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OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



July 7, 2004, 10:48:26 ; Search time 6758 Seconds 

(without alignments) 
12160.509 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



27513289 seqs, 14931090276 residues 



Total number of hits satisfying chosen parameters: 



55026578 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 
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em_estba : * 
em_esthum: * 
em_estin: * 
em_estmu: * 
em_estov: * 
em_estpl : * 
em_estro : * 
em_htc : * 
gb_estl:* 
gb_est2 : * 
gb_htc : * 
gb_est3 : * 
gb__est4 : * 
gb_est5 : * 
em_estf un : * 
em_estom: * 
em_gs s hum: * 
em_gss_inv: * 
em_gss_pln: * 
em__gss_vrt : * 
em gs s f un : * 
em_gss_mam: * 
em_gss_mus : * 
em_gss_pro : * 
em_gss_rod: * 
em_gss_phg: * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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KEYWORDS 
SOURCE 
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AY406491 2802 bp DNA linear GSS 15-DEC-2003 

Homo sapiens UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406491 

AY4064 91.1 GI: 397 624 65 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2802) 

Clark, A. G. , Glanowski , S . , Nielson,R., Thomas, P., Ke j ariwal , A. , 
To'dd, M. A. , Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2802) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2802 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
<1. .>2802 
/gene="UNC5C" 
/locus_tag="HCM2575" 



ORIGIN 



Query Match 34.9%; Score 960.2; DB 29; Length 2802; 

Best Local Similarity 61.3%; Pred. No. 1.2e~153; 

Matches 1682; Conservative 0; Mismatches 995; Indels 69; Gaps 6; 

Qy 57 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 116 

I I I I II I I I I I I II II MINI I III I 

Db 66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 



Qy 117 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 176 

II I I I I I I I I II I I I I I I I I I I I 

Db 126 TGATGACTTTTTTCATGAACTCCCAGAAACTTTTCCTTCTGATCCACCTGAGCCTCTGCC 185 



Qy 177 CCAC TT C CT GGT GGAG C CC GAGGAT GT GT ACAT C GT CAAGAAC AAG C CAGT GCT GCT T GT 236 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 186 ACAT TT C CT T ATT GAG CCT GAAGAAGCTTAT AT T GT GAAGAATAAGC CT GT GAAC CT GT A 245 

Qy 237 GTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCA 296 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II 

Db 24 6 CTGTAAAGCAAGCCCTGCCACCCAGATCTATTTCAAGTGTAATAGTGAATGGGTTCATCA 305 

Qy 2 97 GGT GGAC C AC GT GAT C GAGC G C AGCAC AGAC GGGAGC AGT GGGCTGCC C AC CAT G GAG GT 356 

I I I I I I I I I III II I I I I I I I I I I I I I I I 

Db 306 GAAGGAC CAC AT AGT AGAT GAAAGAGT AGAT GAAACT T CC GGT C T CATT.GT CCGGGAAGT 365 

Qy 357 C C GCAT TAAT GT CT CAAGGC AGCAGGT C GAGAAG GT GTT C GGGC T GGAGGAAT ACT GGT G 416 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 366 GAGCAT T GAGAT T T CGC GCC AGCAAGT GGAAGAACT C T TT GGAC CT GAAGATTACT GGT G 425 

Qy 417 CCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCAT 476 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I 
Db 426 CCAGTGTGTGGCCTGGAGCTCCGCGGGTACCACAAAGAGCCGGAAGGCGTATGTGCGCAT 485 

Qy 477 AGC CAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCT 530 

II I I I I I I I I II I I I I I I I I II I I I I I I I I I II I 

Db 4 86 TGCATNNNNNNNNNNNCGGAAGACATTTGAGCAGGAACCCCTAGGAAAGGAAGTGTCTTT 545 

Qy 531 GGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGA 590 

I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 54 6 GGAACAGGAAGT CTTACT CCAGT GT CGACCACCT GAAGGGAT C CCAGT GGCT GAGGTGGA 605 

Qy 591 GTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCG 650 

M I I I I I I I I I I I I I I I III I I I I II I I I I 

Db 606 AT G GT T GAAAAAT GAAGAC AT AAT T GAT C C C GT T GAAGAT C GGAAT T T T TAT AT T AC TAT 665 

Qy 651 G GAGCAC AGC CT G GT GGT G C GAC AGG C CCGCCTTGCT GACAC GG C CAACTACAC CT GC GT 710 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 666 T GAT CAC AAC CT C AT CAT AAAGC AG GC C C GACT CT CT GAT ACT G CAAATT ACAC CT GT GT 725 

Qy 711 GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 770 

I I I I I I I I I I I I I I I II I III I I I I I I I I I I I I I I I I 

Db 726 TGCCAAAAAC ATT GTTGCCAAGAGGAAAAGTACAACT GCCACTGT CAT AGTCTAT GT CAA 785 

Qy 771 CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 830 

I I I I I I Mill II I I II I I I I I I I I I II II I I I I II I I I I II II I 
Db 7 86 CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

Qy 831 GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 890 

I I I I I I I I I III II I I I I I I I I I I I II I I I I I I I I I I II II I I II I I 
Db 846 TCAGAAACGTACAAGGACTTGTACCAACCCGGCACCACTC7\ATGGGGGTGCCTTCTGTGA 905 

Qy 891 GGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAG 950 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 906 AGG GCAGAGT GT G CAGAAAAT AG C CT GT ACT AC GT TAT GC C CAGT GGAT GGCAGGT GGAC 965 

Qy 951 CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 1010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9 66 GCCATGGAGCAAGTGGTCTACTTGTGGAACTGAGTGCACCCACTGGCGCAGGAGGGAGTG 102 5 



Qy 1011 CT CT GAC C CAG CAC C C C GCAAC GGAGG GGAGGAGT GC CAGGGC AC T GAC CT GGACAC C C G 1070 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1026 CACGGCGCCAGCCCCCAAGAATGGAGGCAAGGACTGCGACGGCCTCGTCTTGCAATCCAA 1085 

Qy 1071 CAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTA 1130 

I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I 
Db 108 6 GAACT GC ACT GAT GGGC T TT G C AT GC AGACT GCT C CT GAT T CAGAT GAT GTT G CT CT CTA 1145 

Qy 1131 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1187 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I 

Db 114 6 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

Qy 1188 CGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCAC 1247 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1206 T GT GT AT C GGAAGAAT CAT C GT GACT T T GAGT CAGAT AT TATT GACT CT T C GGCACT CAA 1265 

Qy 1248 CT CAG GCT T C C AGC C C GT C AGC AT CAAGC C C AGCAAAGC AGAC AAC C C C CAT C T G CT CAC 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1266 TGGGGGCTTTCAGCCTGTGAACATCAAG GCAGCAAGACAAGATCTGCTGGC 1316 

Qy 1308 CATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCA 1367 

II I I I I I I I I I I I I III III II I II I I I I I I I I 
Db 1317 T GT AC CC C CAGAC C T CAC GT C AG CT GC AGC CAT GT ACAGAGGAC CT GT CT AT GC C CT GC A 137 6 

Qy 1368 GGATG GGCCCAGCCCCAAGTTCCAGCTCACCAAT GGGCACCTGCTCAGCCC 1418 

Ml II I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1377 T GAC GTCT CAGACAAAAT C CCAAT GAC CAACT CT C CAATT CT GGAT C CAC T GC C CAAC CT 1436 

Qy 1419 CCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTT 147 8 

I I I I I I I I I I I II I I I I I I I 

Db 1437 GAAAAT C AAAGT GT AC AAC AC C T CAG GT G C T GT CAC C C C C CAAGAT GAC C T CT C T GAGT T 1496 

Qy 1479 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 1538 

III I I I I I I I I I I I I I I I II II I I 

Db 1497 TACGTCCAAGCTGTCCCCTCAGATGACCCAGTCGTTGTTGGAGAATGAAGCCCTCAGCCT 1556 

Qy 1539 GA CCTATGGGACCTTCAA 1556 

M I I I I I I I I I I I I 

Db 1557 GAAGAACC AGAGT CTAGCAAG G C AGACT GAT C CAT C CT GT AC CGC AT TT GGCAGCTT CAA 1616 

Qy 1557 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 

Db 1617 CTCGCTGGGAGGTCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 167 6 

Qy 1617 T GCCAT ACCC C GAGGGAAGAT CTAT GAGAT CT ACCT CACGCT GCACAAGC CGGAAGACGT 1676 

I I I I I I I I I II I I I I I I I I I I I II III I I I I I I III I 
Db 1677 G G C CAT T C C C C AAG G GAGAGT C T AC GAAAT GT AT GT GACT GT AC AC AG GAAAGAAAC TAT 1736 

Qy 1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I I I I I I I I I I I I I I I I I I Ml II I I I I I I I I I I I I I I II 
Db 1737 GAGGCCACCCATGGATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCC 1796 

Qy 1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 17 96 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I 
Db 17 97 AGGAGCT CT G CT CAC CC G C C C AGT CGT C CT CAC TAT GCAT C ACT G C G CAGAC C C CAAT AC 1856 

Qy 1797 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 
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II l 1 1 1 1 II I I I 1 1 I I 1 1 l I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 

1857 CGAGGACTGGAAAATACT GCT CAAGAAC CAGGCAGCACAGGGACAGT GGGAGGAT GT GGT 



1916 



1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 

1917 GGTGGTCGGGGAGGAAAACTTCACCACCCCCTGCTACATTCAGCTGGATGCAGAGGCCTG 1976 

1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 197 6 

I I I I I I I I I I I I I I I II II 111111111111 II III II 
1977 CCACATCCTCACAGAGAACCTCAGCACCTACGCCCTGGTAGGACATTCCACCACCAAAGC 2036 

1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

2 037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 

2037 CAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCT 2096 

M I I I I I I I I I I I I I I III I I I I I II I II I I I I I II I I I I I I I II II 
2 097 CAGCAT C CGAGT CT ACT GT CT GGAT GACAC C CAGGAT GC C CT GAAGGAAATT T TAC AT CT 2156 

2 097 GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CACGGGTCCT GCACTTCAAGGACAG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2157 TGAGAGACAGATGGGAGGACAGCTCCTAGAAGAACCTAAGGCTCTTCATTTTAAAGGCAG 2216 

2157 TTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
2217 C AC C C AC AAC CTGCGCCTGT C AAT T C AC GAT AT C G C C CAT TCCCTCTG G AAG AG C AAAT T 2276 

2217 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2276 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III 
2277 GCT G GC TAAATATC AGGAAATT C CATT T TAC CAT GT T T GGAGT GGAT CT CAAAGAAAC CT 2336 

2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2337 GC ACT GC AC CT T CACT CT G GAAAGATT T AGC C T GAAC ACAGTGGAGCT GGTT T G CAAACT 2396 

2337 GTGGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCATCAACTT CAACATCACCAA 2396 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2397 CT GT GT G C GGCAGGT GGAAG GAGAAGGGCAGAT CT T C CAGC T CAACT GCACC GT GT C AGA 2456 

2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I I I I I I I I I I I I II I I I I I 

2457 GGAACCTACTGGCATCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCAC 2516 

2457 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2516 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I II I I I 
2517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 2576 

2517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2577 T GC C CC C C AGAC GAGAGGC CAT GACT G GAGGAT GCT GGCC CAT AAG CT GAAC CT GGACAG 2636 

2577 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2636 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 637 GTACTTGAATTACTTTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGA 2696 

2 637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 



Db 2697 AGCACAGAACTT C C C AGAT GGAAAC CT GAG CAT G CT G G CAGCT GT CTT G GAAGAAAT GGG 2756 



Qy 2 697 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I II II III II I I I I III II 

Db 2757 AAGAC AT GAAAC GGT G GT GT C CT TAGCAG CAGAAGGGCAGT ATTAA 2802 
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gene 



GI.-39762467 



(house mouse) 



Craniata ; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus . 



ORIGIN 



AY406493 2791 bp DNA linear GSS 15-DEC-2003 

Mus musculus UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406493 
AY406493.1 
GSS. 

Mus musculus 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 

1 (bases 1 to 2791) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2791) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2791 

/organism-"Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>2791 
/gene-"UNC5C" 
/locus_tag="HCM2575" 



Query Match 34.5%; 
Best Local Similarity 62.3%; 
Matches 1653; Conservative 



Score 950.4; DB 29; 
Pred. No. 5.6e-152; 
0; Mismatches 921; 



Length 2791; 
Indels 80; Gaps 



7; 



Qy 



Db 



14 9 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 2 08 

Ml Ml I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

158 T T C CAT CT GACC C AC CT GAGC CAT T G C CACACTT C CT CAT T GAGCC C GAGGAAGC T T AC A 217 



Qy 



2 09 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 2 68 



Db 218 T T GT GAAGAACAAGC CT GT GAAC CT GTAT T GT AAAGC CAGC C CT GC CAC C CAGAT CT ACT 277 

Qy 269 TCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACG 32 8 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I Ml || M I I 

Db 278 T C AAGT GCAACAGC GAGT G G GTT CAT CAGAAGGAC CAC GT AGT AGACGAGAGAGT AGAT G 337 

Qy 329 GGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGA 388 

M Mill I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 338 AAAC CT CT GGT CT AAT T GT GAGAGAAGT GAG CAT T GAGAT TT CAC GC CAGCAGGT GGAG G 397 

Qy 389 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 44 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 398 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 457 

Qy 449 C C AAG AGT C AG AAG G C C T AC AT C C G CAT AG C C AG ATTGCGCAAGAACTTCGAGC 502 

I I I I I I M I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 458 C GAAGAGT C G GAAGGCAT AC GT GC GCATT GC GT T T C CAGAT CT GC G GAAGACAT T C GAGC 517 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 518 AGGAACCCTTGGGAAAGGAAGTGTCCTTGGAGCAGGAAGTCTTACTCCAGTGTCGGCCAC 577 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 578 CTGAAGGGATCC GT AGAAT G GC T AAAGAAT GAAGACAT AAT T GAT C CT G 626 

Qy 623 C C CT GGAC C C CAAT GTAT AC AT CAC GC GG GAGCACAGC CT G GT GGT GC GAC AGGC C C GC C 682 

I I I I M I I I I I I I I I II II I I I I I I I I I I I II I 

Db 627 CT GAAGAT C GGAAC T T TTAT AT TACT AT C GAT CACAACCT GAT CAT CAAG CAAGC C CGAC 686 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | Ml 

Db 687 T CT CAGAT ACAGCAAAT TAT AC CT GT GTTGC CAAAAATAT T GT T GC CAAGAGAAAAAGC A 74 6 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

M I M I I I I I I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 747 C CACAGC CAC T GT CAT C GT GTAT GTTAATGGTGGCT GGT C CAC CTG GAC AGAGT GGT CTG 806 

Qy 8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 8 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 807 TGTGTAACAGCCGCTGTGGGCGAGGATATCAGAAACGCACAAGAACCTGCACCAACCCAG 866 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I M I I I I I II II II I I I I I I I I I I I I I I I I III I I I I I I I Ml Ml I I 
Db 8 67 CCCCACTCAATGGTGGGGCCTTCTGTGAGGGGCAGAGTGTGCAGAAAATAGCATGCACTA 92 6 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 927 C GT TAT GT C CAGT GGAT GGT AGGT GGAC TT CAT G GAG C AAAT GGT CAAC CT GT GGGACT G 98 6 

Qy 983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I III 
Db 987 AATGCACCCACTGGCGCAGGAGGGAGTGTACAGCACCAGCCCCCAAGAACGGGGGTAAGG 1046 

Qy 1043 AGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTG 1102 

III I I I I I I I I I II I I I I I I I II I I I I III II 



Db 1047 ACTGTGATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGCTG 1106 

Qy 1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCC 1159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 

Db 1107 CT C CT GACT C AGAT GAT GT G GCT CT CT ACGT GGG GAT T GT GAT C GCT GTAACAGT CT GT C 1166 

Qy 1160 TGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACT 1219 

III I I I I I I I I I I I I I I I I I I I I I I I 

Db 1167 TGGCGATCACTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGT 1226 

Qy 1220 CAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1227 CT GACAT CAT T GACT CCT CAGCACT CAAT GGCGGCTTT CAGC CT GT GAACAT CAAG 1282 

Qy 1280 GCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCA 1339 

I I I I I I I I I I I I I III I I I I I I I II I I I I III 
Db 12 83 GCTGCCAGACAAGATCTCCTGGCTGTCCCCCCTGACCTCACCTCAGCTGCAGCCA 1337 

Qy 1340 CCTACCAGGGCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCT 1394 

III III I I I I I I I I I I I I I I II I I I I II I I I I I 

Db 1338 T GT ACAGGGGACCT GT CT AT GCT CT GC AT GAT GT CT C AGACAAAAT C C CAAT GAC CAACT 1397 

Qy 1395 CACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTC 1454 

I I I I I I I I I I I I I I I I I I I II I 

Db 1398 CT C CAAT T CT GGAC C CACTAC CCAACT T GAAAAT CAAAGT GTACAACAGCT C AGGT GCT G 1457 

Qy 1455 TCCCACCTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 14 98 

I I I I I I I III I I I I I I I III I I I I III 

Db 1458 T CACT C CT C AGGAT GAC CT T G C C GAGT T CT CAT C C AAACT GT C AC C C C AGAT GAC C CAGT 1517 

Qy 14 99 AGAACTACTTCCGCTCCCTGCCCCGAGGCA 152 8 

I I I I I I I I I I I II 

Db 1518 C C T T G C T AG AG AAT GAG G C C C T T AAC C T GAAG AAC C AG AG C C T C G CAAG AC AG AC T GAC C 1577 

Qy 1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1588 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1578 CATCCTGCACAGCATTTGGTACCTTCAACTCTCTTGGGGGTCACCTCATCATTCCTAATT 1637 

Qy 1589 CAGGT AT CAGC CT C C T CAT C C CC C CAGAT GC CAT ACC C C GAGGGAAGATCT AT GAGAT CT 1648 

I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1638 CAGGAGTAAGCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGT 1697 

Qy 1649 AC CT C AC G CT GC AC AAG C C G GAAGAC GT GAGGT T G C C C C T AGCT GG C T GT C AGAC C CT GC 1708 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1698 ATGT GACTGTACACAGGAAAGAAAATAT GAGGCCCCC CAT GGAAGACT CTCAGACCCT AC 1757 

Qy 17 09 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1768 

II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1758 TTACCCCTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCA 1817 

Qy 17 69 CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 1828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
Db 1818 CTCT GCAT CACT GT GCAGAC CCCAGCACCGAGGACT GGAAGAT CCAGCT CAAAAACCAGG 1877 

Qy 1829 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 1888 

I I I I I I I I I I I I I I I I II I I I I I I I I I II MM 

Db 1878 CAGT G CAG GGACAAT GG GAG GAT GT T GT GGT GGT T GG G GAGGAGAACT T CACAAC CC C CT 1937 



188 9 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 194 8 

Ml I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1938 GT T AC ATT CAGC T GGAT GC AGAGGCT T G C CAT AT C CT C ACAGAGAAC CT CAGTAC CTAT G 1997 



194 9 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 2008 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

1998 CCCTGGTTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTG 2057 

2009 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCC 2068 

I I I I I M I I I I I I I I I I Ml I I I I I I I 

2 058 GGCCCCTCTGCTGCTCTTCCCTGGAGTACAGCATTAGAGTCTACTGCCTGGATGACACAC 2117 

2069 ACGATGCACT CAAGGAGGT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCTGATC CAGG 212 8 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II 
2118 AGGAT G C CCT GAAGGAAGT T CT ACAACT G GAGAGGCAAAT GG GAGGACAG CT C CT AGAAG 2177 

2129 AGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATG 2188 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2178 AACCCAAGGCTCTTCATTTTAAAGGCAGCATCCACAACCTGCGCCTGTCTATTCATGACA 2237 

218 9 TGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATC 224 8 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2238 TCGCCCATTCCCTCTGGAAGAGCAAATTGCTGGCTAAGTATCAGGAAATTCCATTTTACC 2297 

2249 ACAT CT G GAAT G GCAC G CAGC GGT ACT T GCACT G CAC CTT CAC C CT GGAG CGT GT C AGCC 2308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2298 ACATCTGGAGTGGCTCTCAAAGAAACCTCCACTGCACCTTCACTCTGGAAAGACTCAGCC 2357 

2309 CCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGA 2368 

I Ml MINI I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2358 TAAACACAGTGGAACTGGTTTGCAAACTCTGTGTGCGGCAGGTTGAAGGAGAAGGGCAGA 2417 

2369 GCTTCAGCATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGG 2428 

I I I I I I I I I I I I I I I I I II II II I I I I 

2418 TCTTCCAGCTCAACTGTACTGTGTCAGAGGAACCTACTGGCATCGACTTACCTCTCCTGG 2477 

2429 AGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCA 2488 

I M Ml I I I I I I I I I I I I I I I I I I I III I 

2478 ACCCTGCTAGTACCATCACCACTGTCACCGGACCAAGTGCTTTCAGCATTCCTCTCCCTA 2537 

2489 TT C GGC AGAAGAT AAT T T C C AGC CT GGAC C CAC CCT GT AG GCGGGGTGCC GACT GGC G GA 2548 

I I II I I I I I I I I I I I I I I I I I III I III I I I I I I I I I 

2538 TCCGGCAGAAGCTATGCAGCAGCCTGGATGCCCCTCAAACAAGAGGCCATGACTGGAGGA 2597 

2549 CTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCC 2608 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I I I I I I I 
2598 TGCTGGCCCATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCC 2657 

2609 CCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCC 2668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2658 CAACT GGC GTAAT C CT GGAT CTT T GG GAAGCAC AGAACTT C CC AGAT G GAAAC CT GAGCA 2717 

2669 AGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGG 2728 

I I I I I I II I III I I II I I I II II III I || 

2718 T G CT GGCAGC C GT C CT G GAAGAAAT GG GAAGAC AT GAGAC AGT GGT GT C C T T G G CAGC AG 2777 



Qy 2729 AGGCTGAGTGCTGA 2742 

II III III 
Db 277 8 AAGGACAGTATTGA 2791 
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AK031655 
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REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 



AK031655 3790 bp mRNA linear HTC 18-SEP-2003 

Mus musculus 13 days embryo male testis cDNA, RIKEN full-length 
enriched library, clone : 6030473H24 product:unc5 homolog (C. 
elegans) 3, full insert sequence. 
AK031655 

AK031655.1 GI: 26327502 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodent ia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M. , Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A., 
Yamamoto,R., Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi , K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3790) 



AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A. , Hashizume, W . , 
Hayashida,K. , Hayatsu,N., Hiramoto, K. , Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa, T . , 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,R\, Kouda,M., 
Koya,S., Kurihara, C. , Matsuyama, T . , Miyazaki,A. , Murata,M., 
Nakamura,M. , Nishi,K., Nomura, K., Numazaki, R. , Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume, N . , 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu, M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted (16-JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan ( E-mail : genome-res@gsc . riken . go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-4 5-503-9222, 
Fax: 81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL :http: //genome. gsc. riken. go. jp/ 
URL:http : / / fantom. gsc . riken . go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .3790 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/ db_xref ="FANTOM__DB : 6030473H24 " 

/db_xref="MGI: 2394911" 

/db_xref="taxon: 10090" 

/clone="6030473H24" 

/sex="male" 

/t is sue_type= n testis" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_jstage="13 days embryo" 
CDS 118. .2970 

/note="unnamed protein product; putative 
unc5 homolog (C. elegans) 3 (MGD | MGI : 10954 12 , 
GB|NM_009472, evidence: BLASTN, 99%, match=464)" 
/ codon_start=l 
/protein_id= " BAC2 74 95.1" 
/db_xref="GI: 26327503" 

/ trans la tion="MRKGLRATAARCGLGIGYLLQMLVLPALALLSASGTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKAS PATQIYFKCNSEWVHQ 
KDHVVDERVDETSGLIVREVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEDIIDPAEDRNFYI 
T I DHN L 1 1 KQARL S DT AN YT CVAKN I VAKRKS T TAT VI VYVN G GWS TWT EW S VCN S RC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQGFIYPISTEHRPQNEYGFSSAPD 
SDDVALWGIVIAWVCIAITVWALFVYRKNHRDFESDIIDSSALNGGFQPWIKAA 
RQDLLAVPPDLTSAAAMYRGPVYALHDVSDKIPMTNSPILDPLPNLKIKWNSSGAVT 



PQDDIJ\EFSSKLSPQMTQSLLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLIIPN 
SGVSLLIPAGAIPQGRVYEMYVTVHRKENMRPPMEDSQTLLTPWSCGPPG7VLLTRPV 
ILTLHHCADPSTEDWKIQLKNQAVQGQWEDWWGEENFTTPCYIQLDAEACHILTEN 
LSTYALVGQSTTKAAAKRLKLAIFGPLCCSSLEYSIRVYCLDDTQDALKEVLQLERQM 
GGQLLEEPKALRFKGSIHNLRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHC 
TFTLERLSLNTVELVCKLCVRQVEGEGQIFQLNCTVSEEPTGIDLPLLDPASTITTVT 
GPSAFSIPLPIRQKLCSSLDAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDL 
WEAQNFPDGNLSMLAAVLEEMGRHETVVYLAAEGQY" 

ORIGIN 

Query Match 33.6%; Score 923.4; DB 11; Length 3790; 

Best Local Similarity 61.3%; Pred. No. 2.7e-147; 

Matches 1659; Conservative 0; Mismatches 926; Indels 120; Gaps 6; 

Qy 14 9 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 275 TTCCATCTGACCCACCTGAGCCATTGCCACACTTCCTCATTGAGCCCGAGGAAGCTTACA 334 

Qy 2 09 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 2 68 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 335 TTGT GAAGAACAAGCCT GT GAACCT GTATTGTAAAGCCAGCC CTGCCAC CCAGAT CTACT 394 

Qy 2 69 T CAAGT GCAAC G GG GAGT GGGT GC GCCAGGT GGAC CAC GT GAT CGAGC GCAGCAC AGAC G 328 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I III II I II I 

Db 395 T C AAG T G C AAC AGC GAGT G G GT T CAT C AGAAG G AC CAC GT AGT AG AC GAG AG AGT AGAT G 4 54 

Qy 32 9 GGAGCAGT GGGCT GCCCACCAT GGAGGT CC GCATTAAT GT CT CAAGGCAGCAGGT CGAGA 38 8 

II Mill I I I I I I I I I I I I I I I I I i I I I I I I I I I 

Db 455 AAACCT CT GGT CTAATTGT GAGAGAAGT GAGCATT GAGATTTCACGCCAGCAGGT GGAGG 514 

Qy 38 9 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 448 

I MM Mil I I M II II I II M I I I II I II I I I I II II II I I M I I I 

Db 515 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 57 4 

Qy 44 9 CCAAGAGT CAGAAGGCCT ACAT CCGCATAGCCAGATTGC GCAAGAACTT CGAGCAGGAGC 508 

I II I I I II I II I II I I I I II II I I I M I I M I I M I II I II M I I 

Db 575 CGAAGAGT C GGAAGGCATACGT GCGCATT GCGTAT CTGCGGAAGACATTCGAGCAGGAAC 634 

Qy 509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I II I I II I I I M I M I II II I I I I MIMI M II M I II II I 

Db 635 CCTTGGGAAAGGAAGTGTCCTTGGAGCAGGAAGTCTTACTCCAGTGTCGGCCACCTGAAG 694 

Qy 569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 628 

MUM II I I II I II II I II I II I I I II I Mill I I 

Db 695 GGATC CCAGTGGCTGAGGTAGAATGGCTAAAGAAT GAAGACATAATTGATCCT GCT GAAG 754 

Qy 62 9 ACCCCT^ATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 688 

II M I I I II I I I I I I II II I I I I II II I II I I II 

Db 7 55 ATCGGAACTTTTATATTACTATCGATCACAACCTGATCATCAAGCAAGCCCGACTCTCAG 814 

Qy 689 ACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCG 74 8 

I I I I I II I I I I II II II II I II I I I I I I I I I I II I II 

Db 815 ATACAGCAAATT ATACCT GTGTTGCCAAAAAT ATT GTT GCCAAGAGAAAAAGCACCACAG 874 

Qy 74 9 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 808 

I I I I II I II I I II II II I II II Mill II I II II II II II I I II II I 
Db 875 CCACTGTCATCGTGTATGTTAATGGTGGCTGGTCCACCTGGACAGAGTGGTCTGTGTGTA 934 



Qy 809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC> 868 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 
Db 935 ACAGCCGCTGTGGGCGAGGATATCAGAAACGCACAAGAACCTGCACCAACCCAGCCCCAC 994 

Qy 8 69 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 928 

I I I I II II II I I I I I I I I I I I I I I I I III I I I I I I I III | I I I II I I 
Db 995 T CAATG GT GGGGC CTT CT GT GAG G GGC AGAGTGT GCAGAAAAT AGCAT GC ACT AC GT TAT 1054 

Qy 929 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 988 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1055 GTCCAGT GGAT GGTAGGT GGACTT CAT GGAGCAAATGGTCAACCT GT GGGACT GAAT GCA 1114 

Qy 989 CCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCC 1048 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
Db 1115 CCCACT GGC GCAGGAG GGAGT GT ACAGCAC C AGC C C C CAAGAAC GGG G GT AAGGACT GT G 1174 

Qy 1049 AGG G CACT GAC CT GGAC AC C C GCAACT GTAC CAGT GAC CT CT GT GT AC AC AG 1100 

I I I I I Ml I II I I I I I I I II I I I I III I 
Db 1175 ATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGGATTCATTT 1234 

Qy 1101 TGCTTCTGGCC 1111 

I I I I III I 

Db 1235 AC C C CAT T T C AAC T GAG C AC AG AC C C C AG AAT GAAT AT G GAT TTTCTTCTGCTCCT GAC T 1294 

Qy 1112 CTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGC 1168 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1295 C AGAT GAT GT G GCT CT CT AC GT GGG GAT T GT GAT C GC T GTAACAGT CT GT CT GGC GAT C A 1354 

Qy 1169 TGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGG 1228 

I III II I I I I I I I III I I I I I I I I I I 

Db 1355 CT GT T GT GGT GGCC CT GT TT GT GT AT C GGAAGAAC CAC C GT GACT T T GAGT CT GACAT CA 1414 

Qy 1229 CTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAG 1288 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1415 TTGACTCCTCAGCACTCAATGGCGGCTTTCAGCCTGTGAACATCAAG GCTG 14 65 

Qy 12 89 AC7\ACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGG 1348 

II I I I I I I I I III I I I I I I I I I I I I I IN Ml || 

Db 14 66 C CAGACAAGAT CTCCTGGCTGTCCCCCCT GAC CT C AC CT CAG CT GCAGC CAT GTACAGGG 1525 

Qy 1349 GCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAATGG 1403 

I II I I I I I II I I I I I I I I I I I I 

Db 1526 GAC C T GT C TAT G C T C T G CAT GAT GT C T C AG AC AAAAT C C C AAT GAC CAAC T C T C C AAT T C 1585 

Qy 1404 GCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTC 1463 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 1586 T GGAC CCACTACCCAACTT GAAAATCAAAGT GTACAACAGCT CAGGTGCTGT CACT CCT C 1645 

Qy 1464 TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1498 

II I I I I I I I I III I I I I III 

Db 1646 AGGATGACCTTGCCGAGTTCTCATCCAAACTGTCACCCCAGATGACCCAGTCCTTGCTAG 1705 

Qy 1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACA 1537 

I I I I I I I I I I I III III 

Db 1706 AGAAT GAGG CC CT T AAC CT GAAGAAC CAGAGC CT C GCAAGACAGACT GAC C CAT C CTGC A 1765 
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1538 TGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCA 1597 

I I I I I I II I I I I I I I MINIM M I I I I I I I I I I I I I I II 
1766 CAGCATTTGGTACCTTCAACTCTCTTGGGGGTCACCTCATCATTCCTAATTCAGGAGTAA 1825 

159 8 GCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGC 1657 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I III 
1826 GCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGACTG 1885 

1658 TGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCA 1717 

I M I I I Ml I M M I I I I I I I M I M I I I I II II I || 
1886 T ACACAGGAAAGAAAATAT GAGGCCC CCCATGGAAGACT CT CAGAC CCT ACT TAC CCCT G 1945 

1718 TCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACC 17 77 

I I I I I I I I I M M II M I I I I I II I II II M I I I II I I I M M I I 

194 6 TGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGCATC 2005 

1778 AC T GT G G GGAGC C CAGC C CT GAC AGCT GGAG CCTGCGCCT C AAAAAGC AGT C GT GC GAGG 1837 

I I I I I I II I I I II I I M II II I II M I II M I II I I Ml 
2006 ACT GTGCAGACCC CAGCACCGAGGACT GGAAGAT CCAGCT CAAAAAC CAGGCAGTGCAGG 2065 

1838 GCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCC 1897 

I I M II II I I M II I I I I I I I I I II II I I M | I 

2066 GACAAT GGGAGGAT GT T GT GGT GGTT G GGGAGGAGAACTT CACAAC C C C CT GT TAC AT T C 2125 

1898 AGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGG 1957 

M I I I I I II II II I I I I II II II I I II I M II II I I II I I 

2126 AGCTGGATGCAGAGGCTTGCCATATCCTCACAGAGAACCTCAGTACCTATGCCCTGGTTG 2185 

1958 GAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGG 2017 

I MM Ml I I I I I II II I II I I II I I I M I I 

218 6 GGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCCTCT 2245 

2 018 C CT G CAC CT C C CT C GAGT ACAACAT C C G GGT CT ACT GC CT GC AT GAC AC C C AC GAT GC AC 2077 

M I I I Mill I II I II I III I I I II II II II II I II I II I II II I II I 
224 6 GCTGCTCTTCCCTGGAGTACAGCATTAGAGTCTACTGCCTGGATGACACACAGGATGCCC 2305 

2078 TCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGG 2137 

I I I II I II I II M I II II I II I I M II II II II I I II II II 
2306 T GAAGGAAGT T CT ACAACT G GAGAGGCAAAT GGGAGGACAG CT C CT AGAAGAAC CCAAGG 2365 

2138 TCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCT 2197 

M I II II I II I II I I I II II I II II I I I I I I I II I II I 
2366 CTCTTCGTTTTAAAGGCAGCATCCACAACCTGCGCCTGTCTATTCATGACATCGCCCATT 2 425 

2198 CCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGA 2257 

M II I II I II II I I I I I I I I I II II I I I I I I II II I II I I II I I I 
242 6 C CCT CT G GAAGAGC AAAT T GCT GGC TAAGTAT CAGGAAATT C CAT T T TAC CAC AT CT GGA 2485 

2258 ATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTA 2 317 

I M I I M I I I I I I II II II II II II II II I I MUM I I II 
24 8 6 GTGGCTCTCAAAGAAACCTCCACTGCACCTTCACTCTGGAAAGACTCAGCCTAAACACAG 2545 

2318 GTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCA 2377 

II I M I II II I II II I II I I II I M M II II II II II I II M 
254 6 TGGAACTGGTTTGCAAACTCTGTGTGCGGCAGGTTGAAGGAGAAGGGCAGATCTTCCAGC 2605 

237 8 T CAACTT CAACAT C ACCAAG GACACAAG GTT T GCT GAG C T G CT G GC T CT GGAG AGT GAAG 2437 



I I I I I I I I I I I I I I I I I I I Mill II 

Db 2606 TCAACTGTACTGTGTCAGAGGAACCTACTGGCATCGACTTACCTCTCCTGGACCCTGCTA 2665 

Qy 2438 CGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGA 24 97 

M I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

Db 2666 GT AC CAT CAC CACT GT C ACC G GAC CAAGT G C T TT CAGC AT T C CT CT C C CTAT C C G GC AGA 2725 

Qy 24 98 AGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCC 2557 

I I I I I II I I I I I I III I III I I I I II I I I I I I I I I I 

Db 2726 AGCT AT GCAGCAG C C T G GAT GC C CCT C AAACAAGAGG C CAT GACT GGAGGAT GCT GGC C C 2785 

Qy 2558 AGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCA 2 617 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I 
Db 27 8 6 ATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCCCAACTGGCG 2 845 

Qy 2618 TGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGC7VACCTCAGCCAGCTGGCTG 2 677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 28 4 6 T AAT CCT GGAT C TT T GGGAAG CAC AGAAC TT C CC AGAT GGAAAC CT GAG CAT GCT G GC AG 2 905 

Qy 267 8 CAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGT 2737 

II II I I I I I I I I I I I I III I I II I III 

Db 2906 C C GT C CT G GAAGAAAT GGGAAGAC AT GAGAC AGT GGT GTACT T GGCAGCAGAAGGAC AGT 2 965 

Qy 2738 GCTGA 2742 

I I I 

Db 2966 ATTGA 2970 
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AK018177 3866 bp mRNA linear HTC 20-SEP-2003 

Mus musculus adult male medulla oblongata cDNA, RIKEN full-length 
enriched library, clone : 6330415E02 product : TRANSMEMBRANE RECEPTOR 
UNC5H2 homolog [Rattus norvegicus], full insert sequence. 
AK018177 

AK018177.1 GI:12857775 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 



Konno, H . , Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A., 
Yamamoto, R. , Matsumoto, H . , Sakaguchi, S . , Ikegami, T . , Kashiwagi, K . , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S w Kawai,J., 
Okazaki,Y., Muramatsu f M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

TITLE RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3866) 

AUTHORS Adachi,J., Aizawa,K., Akahira,S., Akimura,T., Arai,A., Aono,H., 
Arakawa,T., Bono,H., Carninci,P., Fukuda,S., Fukunishi, Y. , 
Furuno,M., Hanagaki,T., Hara,A., Hayatsu,N., Hiramoto,K., 
Hiraoka,T., Hori,F., Imotani,K., Ishii,Y., Itoh,M., Izawa,M., 
Kasukawa,T., Kato,H., Kawai, J w Kojima,Y., Konno, H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Nishi,K., 
Nomura, K. , Numazaki,R., Ohno,M., Okazaki,Y., Okido,T., Owa,C, 
Saito,H., Saito,R., Sakai,C, Sakai,K., Sano,H., Sasaki, D., 
Shibata,K., Shibata,Y., Shinagawa, A. , Shiraki,T., Sogabe,Y., 
Suzuki, H., Tagami,M., Tagawa,A., Takahashi , F. , Tanaka,T., 
Tejima,Y., Toya,T., Yamamura,T., Yasunishi , A. , Yoshida,K., 
Yoshino,M., Muramatsu,M. and Hayashizaki, Y . 

TITLE Direct Submission 

JOURNAL Submitted ( 10- JUL-2000 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

COMMENT Please visit our web site (http://genome.gsc.riken.go.jp/) for 

further details. 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. First strand cDNA was primed with a primer 
[5 f GAGAGAGAGAAGGATCCAAGAGCTCTTTTTTTTTTTTTTTTVN 3'], cDNA was 
prepared by using trehalose thermo-activated reverse transcriptase 
and subsequently enriched for full-length by cap-trapper. cDNA went 
through one round of normalization to Rot =10.0 and subtraction to 
Rot = 100.0. Second strand cDNA was prepared with the primer 
adapter of sequence [5' 

GAGAGAGAGAT T CT C GAGT T AAT T AAAT T AAT CCCCCCCCCCCCC 3 » ] . cDNA was cleaved 



with BamHI and Xhol. Vector: a modified pBluescript KS(+) after 
bulk excision from Lambda FLC I. Cloning sites, 5' end: Sail; 3* 
end: BamHI. Host: DH10B . 
FEATURES Location/Qualifiers 
source 1. .3866 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain= f, C57BL/6J" 

/ db^xref ="FANTOM_DB : 63304 15E02 " 

/db_xref="MGI : 191052 6" 

/db_xref="taxon: 10090" 

/clone= n 6330415E02" 

/sex-"male" 

/tissue_type= M medulla oblongata" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage= "adult" 
CDS 417. .3254 

/note="unnamed protein product; TRANSMEMBRANE RECEPTOR 

UNC5H2 homolog [Rattus norvegicus] ( SPTR | 008722, evidence: 

FASTY, 96.5%ID, 100%length / match=2835) 

putative" 

/codon__start=l 

/protein_id="BAB31108 . 1" 

/db_xref="GI: 12857776" 

/ translation="MRARSGVRSALLLALLLCWDPTPSLAGVDSAGQVLPDSYPSAPA 
EQLPYFLLEPQDAYIVKNKPVELHCRAFPATQIYFKCNGEWVSQNDHVTQESLDEATG 
LRVREVQIEVSRQQVEELFGLEDYWCQCVAWSSSGTTKSRRAYIRIAYLRKNFDQEPL 
AKEVPLDHEVLLQCRPPEGVPVAEVEWLKNEDVIDPAQDTNFLLTIDHNLIIRQARLS 
DTANYTCVAKNIV7^RRST7^TVIVYWGGWSSWAEWSPCSNRCGRGWQKRTRTCTNP 
AP LN G GAFC E GQ AFQ KT ACT T VC P VD GAWT EW S KW S AC S T E CAHWRS RE CMAP P P QN G 
GRDCSGTLLDSKNCTDGLCVLNQRTLNDPKSHPLETSGDVALYAGLWAVFVWAVLM 
AEGVI VYRRNCRDFDTDITDSSAALTGGFHPVNFKTARPNNPQLLHPSAPPDLTASAG 
IYRGPVTAXQDSADKIPMTNSPLLDPLPSLKIKVTNSSTIGSGSGLADGADLLGVLPP 
GTYPGDFSRDTHFLHLRSASLGSQHLLGLPRDPSSSVSGTFGCLGGRLSLPGTGVSLL 
VPNGAIPQGKFYDLYLHINKAESTLPLSEGSQTVLSPSVTCGPTGLLLCRPWLTVPH 
CAEVIAGDWIFQLKTQAHQGHWEEWTLDEETLNTPCYCQLEAKSCHILLDQLGSYVF 
MGESYSRSAVKRLQLAIFAPALCTSLEYSLRVTCLEDTPVALKEVLELERTLGGYLVE 
EPKPLLFKDSYHNLRLSLHDIPH7\HWRSKLLAKYQEIPFYHVWNGSQRALHCTFTLER 
H S LAS T E FT C KVCVRQVEGE GQ I FQ LHTT LAET PAG S L DAL C SAP GNAI T T QLG P YAF 
KI PLS I RQKI C S SLDAPDS RGNDWRLLAQKLSMDRYLNYFATKAS PTGVI LDLWEARQ 
QDDGDLNSLASALEEMGKSEMLVAMATDGDC" 

ORIGIN 

Query Match 31.7%; Score 872.4; DB 11; Length 3866; 

Best Local Similarity 60.6%; Pred. No. 1.4e-138; 

Matches 1646; Conservative 0; Mismatches 941; Indels 129; Gaps 8; 



Qy 157 GCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAG 216 

I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 54 0 GCCCCTGCGGAGCAGCTGCCGTACTTCCTATTGGAGCCACAGGACGCCTACATCGTAAAG 599 

Qy 217 AACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGC 27 6 

I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | 

Db 600 AACAAGC C AGT G GAACT GC ACT G CAGAGC CTT C C CT GC C AC GCAGAT CTACT T CAAGT GT 659 

Qy 277 AAC G GGGAGT GGGT GC G C C AGGT GGAC CAC GT GAT C GAG C GC AGC AC AGAC G G GAGC AGT 336 

I I M I I I I I II I I I I I I MINIM I I Ml I I I I I I 



Db 660 AAT GG CGAGT GGGT CAG C CAGAAT GAC CAC GT CAC AC AGGAGAGC CT G GAT GAGGC CAC A 719 

Qy 337 GGGCTGCC CAC CAT G GAG GT C C GC AT T AAT GT CT C AAGG C AG CAG GT C GAGAAGGT GT T C 396 

II III Mill I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 GGCTTGCGGGTGCGAGAGGTGCAGATCGAGGTGTCACGGCAGCAAGTGGAGGAACTCTTC 77 9 

Qy 397 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 45 6 

I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 780 GGGCTCGAGGACTACTGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGT 839 

Qy 457 C AGAAGG C C T ACAT C C G C AT AGC C AGAT T GC GC AAGAACT T C GAG C AGGAGC C GCT GGC C 516 

I I I I I I I I I I I I I II III I I I I I I I I I I I I I I II I I II I I I I I I I I I I 

Db 84 0 CGCCGAGCCTACATCCGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCC 899 

Qy 517 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 57 6 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 900 AAGGAGGTACCCTTGGATCATGAGGTCCTTCTGCAGTGCCGCCCACCGGAGGGAGTGCCT 959 

Qy 577 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 636 

I I I I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I I I 
Db 960 GT GGCT GAG GTGGAAT GG CT CAAGAAT GAAGAT GT CAT T GAC C C C GCT CAGGACACTAAC 1019 

Qy 637 GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 69 6 

I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 

Db 1020 TTCCTGCT CAC CAT T GAC CAC AAC CT CAT CAT C C GC CAGGC GC GC CT CT C AGAC AC GGC C 1079 

Qy 697 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1080 AACTACACCTGTGTGGCCAAGAATATCGTGGCCAAGCGCCGGAGCACCGCGGCCACAGTC 1139 

Qy 757 ATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGC 816 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I III I II 
Db 114 0 ATCGTCTATGTGAATGGAGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGTTCCAATCGC 1199 

Qy 817 TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 87 6 

I I I I I II I I I I I I I I I I I II I I I I I I II I I I I I I II II II I I I I I II 
Db 1200 TGTGGCCGAGGCTGGCAGAAGCGTACTCGGACCTGCACCAATCCAGCCCCACTCAATGGA 1259 

Qy 877 GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 93 6 

I I I I I I I I I I I I I I I I III II I I I I I Mill III I I I I I II II I I II II 

Db 1260 GGCGCCTTCTGTGAGGGACAGGCCTTCCAGAAGACAGCTTGCACCACCGTGTGCCCAGTG 1319 

Qy 937 GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 996 

MM I I II I I I II II I I I I I II I I I I I II I I I I I I I I I I I I 

Db 1320 GAT GGAGCGT GGACC GAGT GGAGCAAGTGGT CT GCCT GCAGCACAGAGTGT GCGCACT GG 1379 

Qy 997 C GGAGC C GT GAGT GC T CT GAC C CAGCAC C CC GCAAC GGAG GGGAGGAGT GC CAGGGCACT 1056 

I I II I II I I I I I I I II II I II I I II II I II I I I II I I I I 

Db 1380 C GCAGCC GC GAGT GC AT G GCAC C GCC AC C CCAGAAC GGAG GC CGT GACT GCAGC GG GAC G 1439 

Qy 1057 GAC CT GGAC AC C C GCAAC T GT AC C AGT GAC CT CT GT GT AC ACAGT GCT T CT GGC C 1111 

I I I I I I I M I I I II II II I I I I I II I 
Db 1440 CTACTTGACT CCAAGAACTGCACTGAT GGGCT GTGCGTGCT GAAT CAGAGAACT CTAAAC 1499 

Qy 1112 CTGAGGACGTGGCCCTCTATGTGGGCCTCATC 1143 

II I I II II I I I I I I II I I I I 
Db 1500 GAC C CTAAAAGCC AC CC C CT GGAGACAT C GGGAGAT GT GG C ACT GTAC GCAGGC CT T GT G 1559 



Qy 1144 GCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTC CTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1560 GTGGCCGTCTTTGTGGTGGTAGCGGTTCTCATGGCCGAGGGAGTGATCGTATACCGGAGA 1619 

Qy 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGT CCATTCTCACCTCAGGCTTC 1257 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1620 AACTGCCGGGACTTCGACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTC 1679 

Qy 1258 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCT CACCATC 1311 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1680 CACCCTGTCAACTTCAAGACTGCAAGGCCCAACAACCCGCAGCTCCTGCACCCGTCCGCC 1739 

Qy 1312 CAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA- 1370 

I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I 
Db 1740 CCTCCAGACCTAACGGCCAGTGCTGGCATCTACCGCGGGCCTGTGTATGCCCTGCAGGAC 17 99 

Qy 1371 TGGGCCCAGCCCCAAG 138 6 

I I I I I I I I I I I I 

Db 1800 TCCGCCGACAAGATCCCCATGACTAATTCGCCCCTGCTGGATCCCCTGCCCAGCCTCAAG 1859 

Qy 1387 TTCCAGCTCACCAATGGGCACCTGCTCAG C 1416 

I I I I I I I I I I I I I 

Db 1860 ATCAAGGTCTATAACTCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGAC 1919 

Qy 1417 CCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAG 147 6 

I I I I I I I I I M I I I I I II I III II III 

Db 1920 CTGCTGGGTGTCCTCCCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTC 1979 

Qy 1477 TTCGTCTCCCGCCTCTCCACCC AGAACTACTTCCGCTCCCTGCCCCGAGGCACC 1530 

I I Ml I I I I I I I I I I I I I I I I I I I I I I 

Db 1980 CTGCACCTGCGCAGTGCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCC 2039 

Qy 1531 AGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACA 1590 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I Ml 

Db 2040 AGCAGCAGTGTCAGCGGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCTCCCCGGCACA 2099 

Qy 1591 GGT AT CAGC CT C CT CAT C C C C C CAGAT GC C AT AC C C C GAGG GAAGAT CT AT GAG AT C T AC 1650 

M I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I IN 

Db 2100 GGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGTTCTATGACCTGTAT 2159 

Qy 1651 CTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTG 1710 

II I I I I I I I I I I I I II I I I I | I 

Db 2160 CT AC AT AT CAACAAGGC C GAAAGCAC C CT C C CAC T T T CAGAAGGT TC C CAGACAGTAT T G 2219 

Qy 1711 AGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCT 1770 

M III I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I! I I 
Db 2220 AGCCCCTCGGTGACCTGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACC 2279 

Qy 1771 ATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCG 1830 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 

Db 22 80 GT GC CC CACT GT GC T GAAGT CAT C G CT GGAGACT GGAT CTT T CAGCT CAAGAC C CAGGC C 2339 

Qy 1831 TGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTAC 1890 

I I I M I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 
Db 2340 CATCAGGGCCACTGGGAGGAGGTGGTGACCTTGGATGAGGAGACCCTCAACACACCCTGC 2399 



Qy 1891 TACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCC 1950 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 24 00 TACTGCCAGCTGGAGGCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTTCCTACGTA 2459 

Qy 1951 CTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCG 2010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 24 60 TTCATGGGCGAGTCCTACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCC 2519 

Qy 2011 CCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCAC 2070 

II I I I I II I I I II I I I 1 I I I I I II I I II I I II I I III I I I I I I I 

Db 252 0 CCAGCCCTCTGCACCTCCCTGGAGTATAGCCTCAGGGTCTACTGTCTGGAGGACACACCT 2579 

Qy 2 071 GAT GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCTGAT C CAGGAG 2130 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 2580 GTAGCACTGAAGGAGGTCCTGGAGCTGGAGAGGACTCTGGGTGGCTACTTGGTGGAGGAG 2639 

Qy 2131 C C AC GG GT C CT G CACT T C AAGGAC AGT T AC C ACAACCT GC GC CT AT C CAT C C AC GAT GT G 2190 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 264 0 CCCAAGCCTTTGCTCTTTAAGGACAGTTACCACAACCTACGCCTCTCCCTCCATGACATC 2699 

Qy 2191 CC C AGC T C C CT GT G GAAGAGTAAGCT C CT T GT C AG CT ACC AGGAGAT C C C C T T T TAT C AC 2250 

Ml M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 27 00 CCCCATGCCCACTGGAGGAGCAAACTACTGGCCAAGTACCAGGAGATTCCCTTCTACCAC 2759 

Qy 2251 ATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCC 2310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 27 60 GT C T GGAAT GGC AG C C AGAGAGC C CT GCACT GCACT TT C AC C CTGGAGAGG C ATAGC CT G 2 819 

Qy 2311 AGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGC 2 37 0 

III II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2820 GCCTCCACGGAGTTCACCTGTAAGGTCTGCGTGCGGCAGGTCGAAGGGGAAGGCCAGATT 2879 

Qy 2371 TT CAGCAT CAACTT CAACAT CAC C AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTG 2427 

Ml III I III II III II II 

Db 2880 TTCCAGCTGCACACAACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCT 2 939 

Qy 242 8 GAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTC 2 4 87 

I I I III I I I I I I II I I I I I I I I I I I I I I I I II I I 

Db 294 0 GCCCCGGGCAATGCCATCACCACCCAGCTGGGACCCTATGCCTTCAAGATACCCCTGTCC 2 999 

Qy 2488 ATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGG 2547 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 3000 ATCCGCCAAAAGATCTGCAGCAGCCTGGACGCCCCCGACTCCCGGGGCAACGACTGGAGG 3059 

Qy 254 8 ACT C T G GC C CAGAAACT C CAC CT GG AC AGC C AT C T C AG CT T CTTTGCCTC C AAGC C C AGC 2 607 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 

Db 3060 CTGTTGGCGCAGAAGCTGTCCATGGACCGGTACCTAAACTACTTCGCCACCAAAGCTAGT 3119 

Qy 2608 CCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGC 2667 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3120 CCCACAGGTGTCATCTTAGACCTCTGGGAAGCTCGGCAACAGGATGACGGGGACCTCAAC 3179 

Qy 2 668 CAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCG 2727 

I I II I I I I I I I I I I I I I I I I I III I 

Db 3180 AG C CT GG C CAGT GC CTT GGAGGAGAT GG G CAAGAGT GAGAT GCT GGT AGC CAT GGC CAC A 3239 



Qy 



272 8 GAGGCTGAGTGCTGAG 27 4 3 



Db 324 0 GAT GGC GAT TG CT GAG 3255 
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AY406492 2802 bp DNA linear GSS 15-DEC-2003 

Pan troglodytes UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406492 

AY406492.1 GI: 39762466 
GSS. 

Pan troglodytes (chimpanzee) 
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Eukaryota; Metazoa; Chordata; 
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1. .2802 

/organism="Pan troglodytes" 

/mol_jtype=" genomic DNA" 

/db_xref="taxon: 9598" 

<1. .>2802 

/gene="UNC5C" 

/locus jtag="HCM2575" 



ORIGIN 



Query Match 29 . 6%; 

Best Local Similarity 53.8%; 
Matches 1477; Conservative 



Score 814; DB 29; Length 2802; 
Pred. No. 1.2e-128; 
0; Mismatches 1200; Indels 69; 



Gaps 



6; 



Qy 

Db 



57 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 116 

II II II I I I I II I I I I I I I I I I I I I I I 

66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 



Qy 



Db 



117 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 176 

II I I I I I I I I I I I I I I I I I I I I 

126 TGATGACTTTTTTCATGAACTCCCAGAAACTTTTCCTTCGGATCCACCTGAGCCTCTGCC 185 



Qy 177 C CACT T C CT GGT GGAGCC C GAG GAT GT GT ACAT C GT CAAGAACAAGC CAGT G CT G CTT GT 236 

I I I I I I I I II II Mill I I I I I i I I I I I I I I I I I I I I II 
Db 186 ACAT T T C CT T AT T GAAC CT GAG GAAGC T TAT AT T GT GAAGAATAAGC C T GT GAAC CT GT A 245 

Qy 237 GTGCAAGGCC GTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGT 2 90 

M II II I 

Db 24 6 CTGTAAAGCAAGCCCTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 305 

Qy 291 GCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCAT 350 

Db 306 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 365 

Qy 351 GGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATA 410 

Db 366 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 425 

Qy 411 CT GGT GCCAGT GCGT GGCAT GGAGCT C CT CGGGCAC CACCAAGAGT CAGAAGGCCTACAT 47 0 

Db 426 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 485 

Qy 471 C C GC AT AG C C AGAT T GC GCAAGAACT T C GAGC AGGAGC C GCT GGC C AAG GAG GT GT C C CT 530 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 4 86 NNNNNNNNNNNNNNNNCGGAAGACATTTGAGCAGGAACCCCTAGGAAAGGAAGTGTCTTT 54 5 

Qy 531 GGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGA 590 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 54 6 GGAACAGGAAGT CTT ACT C CAGT GT C GGC CAC CT GAAGGGAT C C CAGT GGCT GAGNNNNN 605 

Qy 591 GTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCG 650 

I I M I II I I I I I I III I I I I I I I I I I 

Db 606 NNNNNN GAAAAAT G AAG AC AT AAT T GAT C C C GT T GAAG AT C G GAAT T T T TAT AT T AC TAT 665 

Qy 651 GGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 710 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 666 T GAT CACAACCT CAT CATAAAGCAGGCCCGACT CT CTGATACT GCAAATTAT ACCT GTGT 725 

Qy 711 GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 77 0 

I M I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 

Db 72 6 T G CCAAAAACAT T GT T GC CAAGAGGAAAAGTACAAC T GC CACT GT CAT AGT CT AT GT CAA 78 5 

Qy 771 CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 830 

I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I II I I II I 
Db 78 6 CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

Qy 831 GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 890 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 84 6 TCAGAAACGTACAAGGACTTGTACCAACCCGGCACCACTCAATGGGGGTGCCTTCTGTGA 905 

Qy 891 GGGGCAGAATGT C CAGAAAACAGCCT GCGCCACCCT GTGCCCAGTAGACGGCAGCT GGAG 950 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 906 AG GGCAGAGT GT GCAGAAAAT AGC C T GT ACTAC GT T ATG C C CAGT G GAT GGC AGGT GGAC 965 

Qy 951 CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 1010 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I Mill 

Db 966 GCCATGGAGCAAGTGGTCTACTTGTGGAACTGAGTGCACCCACTGGCGCAGGAGGGAGTG 1025 



Qy 1011 CTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCG 1070 



Ml I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 102 6 CACGGCGC CAGC C CC CAAGAATGGAGGCAAGGACT GC GAT GGC CT! C GT CTT GCAAT C CAA 1085 

Qy 1071 C AACT GT AC C AGT GAC CT CT GT GT AC AC AGT GCTTCTGGCCCT GAG GAC GT G G C C CT CT A 1130 

I I I I I I I II I I I I I II I INI III I I I II I I I I I I I I I 
Db 1086 GAACTGCACTGATGGGCTTTGCATGCAGACTGCTCCTGATTCAGATGATGTTGCTCTCTA 1145 

Qy 1131 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1187 

I I I I I I I I II II I I II I I I I I I I I I I I I I II I 

Db 1146 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

Qy 118 8 CGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCAC 1247 

I I I I I I III I I I I I I I I I I I I MINIM I I I I 

Db 12 06 T GT GT AT C GGAAGAAT CAT C GT GACTT T GAGT CAGATATT AT T GACT CTT C GGC ACT CAA 1265 

Qy 1248 C T C AG G C T T C C AG C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C AC 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1266 TGGGGGCTTTCAGCCTGTGAACATCAAG G CAGC AAGACAAGAT CT G CT GGC 1316 

Qy 1308 CATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCA 1367 

II I I I I I I I I I I I I III III II I I I I I I I I I I I 
Db 1317 T GT AC C C C C AGAC C T C AC GT C AG C T G C AG C CAT GT AC AG AG GAC C T GT CT AT G C C CT G C A 1376 

Qy 1368 GGATG G G C C C AG C C C C AAGT T C C AG CT C AC C AAT GGGCACCTGCTCAGCCC 1418 

Ml II I I I II I I I I I I I I I I I I I I II I I I I I I 

Db 1377 T GAC GT CT CAGACAAAAT CC CAAT GAC CAACT CT C CAATT CT GGAT CCACT GCCCAAC CT 1436 

Qy 1419 CCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTT 1478 

I I I I I I I I I I I III I I I I I I 

Db 14 37 GAAAAT C AAAGT GT ACAAC AC CT C AG GT GCT GT C AC C C C CC AAGAT GAC CT C T CT GAGT T 14 96 

Qy 1479 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 1538 

Ml I I I I I I I I I I I I II I I I I I I I 

Db 14 97 TACGTCCAAGCTGTCCCCTCAGATGACCCAGTCATTGTTGGAGAATGAAGCCCTCAGCCT 1556 

Qy 1539 GA CCTATGGGACCTTCAA 1556 

II I I I I I I I I I I 

Db 1557 GAAGAAC CAGAGT CT AGCAAGG C AGACT GAT C CAT C CT GT AC CGCATTT GG CAGCT T CNN 1616 

Qy 1557 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1617 NTNGCTGGGNNNNCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 1676 

Qy 1617 TGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGT 1676 

I I I II I I I I I I I I I I I I I I I I I I I III I I I I I I III I 
Db 1677 G GC C ATT C CC CAAG GGAGAGT CT AC GAAAT GTAT GT GACT GT AC ACAGGAAAGAAACT AT 1736 

Qy 1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I I I I I I I I I I I I II I I I I III II I I I I I I I I I I I I I I I I 
Db 1737 GAGGCCACCCATGGATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCC 1796 

Qy 1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 17 97 AGGAGCTCTGCTCACCCGCCCCGTCGTCCTTACTATGCATCACTGCGCAGACCCCAATAC 1856 



Qy 



1797 



TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 
II I I I I I II I I I I I I I I I I I I I I I I II I I I I II I I I I 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1857 C GAGGACT G GAAAAT ACT GCT C AAGAAC CAGGC AGC AC AGGGACAGT GGGAGGAT GT GGT 1916 

1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I II I I I III I I II I I I I I I I I I I I I I I I I I II 

1917 GGTGGTCGGGGAGGAAAACTTCACCACCCCCTGCTACATTCAGCTGGATGCAGAGGCCTG 1976 

1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 197 6 

I I I I I I I I I I I I I I I II II I II I I I I I I I I I II III II 
1977 C C AC AT C C T C AC AG AG AAC C T C AG C AC C T AC G C C C T G GT AG G AC AT T C C AC C AC C AAAG C 2036 

1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 

2 037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 

2037 C AAC AT C C G GGT C TACT GC CT GC AT GAC AC C C AC GAT GC ACT C AAGGAG GT G GT G C AGCT 2096 

I I I 1 1 1 I I 1 1 1 1 1 I 1 1 I I I I I I I i I I 1 1 I I 1 1 1 I I I I 1 1 I I I I II I I 

2 097 CAGCAT CCGAGTCT ACT GTCT GGATGACAC CCAGGATGCCCTGAAGGAAATT TTACAT CT 2156 

2 097 GGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I II II II II II I III 
2157 T GAGAGACAGAT GGGAG GACAGCT CCT AGAAGAACCTAAGGCT CT T C ATT T T AAAGG C AG 2216 

2157 TTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

2217 CAC C CACAAC CT GC GC CT GT CAAT T CAC GAT AT C GC C CAT T CCCT CT GGAAGAGCAAATT 2276 

2217 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2276 

I I I I I I I I I III 
2277 GCTGGCTAAATATCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAACCT 2336 

2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 337 GCACTGCACCTTCACTCTGGAAAGATTTAGCCTGAACACAGTGGAGCTGGTTTGCAAACT 2396 

2 337 GT GGGT GT GGCAGGT GGAGGGC GACGGGCAGAGCTT CAGCAT CAACTT CAAC AT CACCAA 2396 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 

2397 CTGTGTGCGGCAGGTGGAAGGAGAAGGGCAGATCTTCCAGCTCAACTGCACCGTGTCAGA 2456 

2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I I I I I I I I I I I I II I I I I I 

2 457 G GAAC CT ACT GGC AT C GAT TTGCCGCTGCT GGAT CCT GC GAACAC CAT CAC CAC GGT CAC 2516 

24 57 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2516 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I II I 
2 517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 257 6 

2 517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 257 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2577 TGCCCCCCAGACGAGAGGCCATGACTGGAGGATGCTGGCCCATAAGCNNNNNNNNNNNNN 2636 



2577 



2637 



2637 



CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2636 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT ACTT GAAT TAC T TT GCCAC CAAAT C CAG C CCAACT G GC GT AAT C CT GGAT CT T T G GGA 2696 



GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 
2697 AG CACAGAACT T C C CAGAT GGAAAC CT GAG CAT GCT GGCAGCT GT CT T GGAAGAAAT GGG 2756 



Qy 

Db 



2 697 C CAGC CAGACGCT GGC CT CTT CACAGT GT CGGAGGCT GAGT GCT GA 2742 

I I I I I I I I I I I I I I III II 
2757 AAGACAT GAAAC GGT GGT GT C CTT AGC AGCAGAAGG G CAGT AT TAA 2802 
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AY411747 2532 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411747 

AY411747. 1 GI: 39767715 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2532) 

Clark, A. G . , Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal , A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T.J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/ Quali f iers 

1. .2532 

/organism-"Homo sapiens" 
/mol type=" genomic DNA 11 
/db_xref="taxon: 9606" 
<1. .>2532 
/ 1 o cu s_t a g= " HCM4 327" 



Query Match 29.4%; Score 810.4; DB 29; 

Best Local Similarity 61.1%; Pred. No. 4.6e-128; 
Matches 1540; Conservative 0; Mismatches 851; 



Length 2532; 
Indels 129; Gaps 



9; 



Qy 



Db 



352 GAGGT CCGCATT AAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCT GGAGGAATAC 411 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 GAGGT GCAGAT C GAG GT GT CGC GG C AGCAGGT GGAGGAG CT CT TT G GG CT GGAGGATT AC 72 



Qy 



Db 



412 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 471 

I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

73 TGGTGCCAGTGCGTGGCCTGGAGCTCCGCGGGCACCACCAAGAGTCGCCGAGCCTACGTC 132 



Qy 472 C GC AT AG C CAGAT TGC GC AAGAAC TT C GAGCAG GAG C C GC T GGC CAAG GAG GT GT C C CT G 531 

I I I I I Ml I I I I I I I I I I I I I I I I MINIM MM M II II M II I II II 

Db 133 CGCATCGCCTACCTGCGCAAGAACTTCGATCAGGAGCCTCTGGGCAAGGAGGTGCCCCTG 192 

Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

I I I I I I I I I I I II II I I I I II I I I II I II I M M M M M I 

Db 193 GACCATGAGGTTCTCCTGCAGTGCCGCCCGCCGGAGGGGGTGCCTGTGGCCGAGGTGGAA 252 

Qy 592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

M M II I M M I M I MUM M I M II M I I I II I I 

Db 253 T GGCT CAAGAATGAGGATGT CATCGACCCCACCCAGGACACCAACTTCCTGCTCAC CAT C 312 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I II M II M I II I I I I I II I I II I M II I II II I II I 

Db 313 GACCACAAC CT C AT CATC CGCCAGGC C CGC CT GT C GGACACT GCCAACT ATAC CT GCGT G 372 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

I I I I II II I M M M I I II I II III II I M I M I II II II I II II I M 

Db 373 GCCAAGAACATCGTGGCCAAACGCCGGAGCACCACTGCCACCGTCATCGTCTACGTGAAT 432 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

M I I I I I M I I II I I I I II M I II I I I I M M I I I I I M II I I 
Db 433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGCTCCAACCGCTGTGGCCGAGGCTGG 492 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

I I I I I II I I I I II I II I I II M I II II II M I M I I I M II I II II III 

Db 493 CAGAAGCGCACCCGGACCTGCACCAACCCCGCTCCACTCAACGGAGGGGCCTTCTGCGAG 552 

Qy 892 GGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGC 951 

M III I II II II II I II II I I I I II I M II II M II II I I I I 

Db 553 GGCCAGGCATTCCAGAAGACCGCCTGCACCACCATCTGCCCAGTCGATGGGGCGTGGACG 612 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I II! II I I I MM I M II I II M I M II M II II 

Db 613 GAGTGGAGCAAGTGGTCAGCCTGCAGCACTGAGTGTGCCCACTGGCGTAGCCGCGAGTGC 672 

Qy 1012 TCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGC 1071 

I II MIMI II II II I I II I I I MM II I II I 

Db 673 ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCT 1107 

II I II I I M II II I II I I 

Db 733 AACT GC ACAGAT GG GCT GT GCAT GCAAAATAAGAAAAC T CTAAGC GAC C CCAACAGC CAC 792 

Qy 1108 GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 1155 

I I I I I II I II I II I I I I I M II I I II I I II I 

Db 793 CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTG 852 

Qy 1156 TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1215 

MM I II I I M I I II I I II I I I I I I 

Db 853 GTCGTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 912 

Qy 1216 GACT CAGAT GT GGCT GAC T C GTCC AT T CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1272 

II I I II I I I II II II I I I I I II I I II II I II II I II I I 

Db 913 GACACAGACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTT 972 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1273 AAG C CCAGC AAAGCAGACAAC C C C CAT CT GCT CACCATCCAGCCGGACCTCAGC 1326 

Mil I I I I I I I I I I I I I I II II I I I I I I I I 

973 AAGACGGCAAGGCCCAGCAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACA 1032 

1327 ACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGG 1374 

I I I I I I II II I II II I I I I I I I II I I I 

1033 GC CAGC G CC GG CAT CT AC C GC GGACC C GT GTAT GCC CT G CAGGACT C CAC C GACAAAAT C 1092 



1375 



1399 



CCCAGCCCCAAGTTCCAGCTCACCA — 

I II I I I I I I I I I I I I I II 
1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 

1400 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC ACACA 1440 

I I I I I I I I I I I I I I I I I I I I 

1153 TCCAGCACCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTG 1212 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

III I I I I I I I I Ml III I II I I I I I 

1213 CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 1272 

1501 AACTACTTCCGCTC CCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I II M I II I M I I I I I I I 

1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGC 1332 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I II II M I I I I I Mill I I II I II I II II II I I M 

1333 GGCACCTTTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTG 1392 

1606 AT CCCC CCAGAT GCCATAC C CCGAGGGAAGAT CT AT GAGAT CTACCT CACGCT GCACAAG 1665 

MM I II II I II I I I I II I I II I II I II M II I Mill 

1393 GT G C C C AAT GGAGC CAT T C C C C AG GGCAAGT T CT AC GAGAT GTAT CT ACT CAT C AAC AAG 1452 

1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I II II II I I II I I II I I II I II I I 

1453 GCAGAAAGTACCCTCCCGCTTTCAGAAGGGACCCAGACAGTATTGAGCCCCTCGGTGACC 1512 

172 6 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 
I I I M I I II I II I II II II I II I II M M I M I I II I II II II II 

1513 TGTGGACCCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCC 1572 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

M III I I I II I I I I I I I II I III I I II I II MM 

1573 GAAGT CAGT GC CCGT GACT GGAT CT TT C AGC T CAAGAC C CAGGC C CAC CAGG GC CACT GG 1632 

184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I M I I I I I II I II II II I II I I I I I II M II II II I II II II I 

1633 GAGGAGGT GGT GAC C CT GGAT GAG GAGAC CCT GAACAC ACC CT GCT ACT GC CAGCT GGAG 1692 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I II I M II I Mill II II I II II II II I I II I II I II 

1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 1752 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I II I I I II II II I II I I I I II II II I II I II II 

1753 TATTCCCGCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACC 1812 

202 6 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAG 2 085 



1872 



I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I MM! I I I I II I MINI 

Db 1813 TCCCTGGAGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCC.TGTAGCACTGAAGGAG 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I II M I I I II I I M I II M I I III I I M I I I II 
Db 1873 GTGCTGGAGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATG 1932 

Qy 214 6 T T CAAGGACAGT T AC CACAAC CT G C GCCT AT C CAT C CAC GAT GT GC C C AGCT CC CT GT G G 2205 

I I M II I I I II II I I I I I I I II II I II I I I I I I I I I I I I I || Ml Ml 

Db 1933 TTCAAGGACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGG 1992 

Qy 22 0 6 AAGAGTAAGCT C CTT GT C AGCT ACCAGGAGAT CC C CTT T TAT CAC AT CT GGAAT GGCAC G 22 65 

I III I I II I II I II I I I II I I M II I I M I I I I I I II I I MM II I I I 
Db 1993 AGGAGCAAGCT GCTGGCCAAATACCAGGAGAT CCCCTT CTAT CACATTT GGAGTGGCAGC 2052 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

III I I I II I I I I I I I II II I I II I I I I I I I I III I I I I 

Db 2053 CAGAAGGCCCT C CACT GCACTT T CACCCT GGAGAGGCACAGCTT GGC CT CCACAGAGCT C 2112 

Qy 232 6 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I II II I II I I II I I II I I I I III I I I 

Db 2113 ACCTGCAAGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACC 2172 

Qy 2386 AAC AT CAC C AAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 2442 

I I I I I III M II I II 

Db 2173 ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 

Qy 2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I II I I I I I II II I I I I I I I I II I I I I I I I I I II II I I I I I I I I I 

Db 2233 GT CAC CAC C C AGCT GGGAC CT T AT G C CT T CAAGAT C C CAC T GT C CAT C C G C C AGAAGAT A 2292 

Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I II I I I II I I II I I I II I II II I I II I I II I I I I I 

Db 2293 T GCAACAGC CT AGAT G CC C CCAACT CAC G GG G CAAT GACT GGCGGAT GT TAGCAC AGAAG 2352 

Qy 2563 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2622 

III II I I I I I I I I I II II I I I II II I I I I II II I I I II I I 

Db 2353 CTCTCTATGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATC 2412 

Qy 262 3 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2 682 

II I I I I I I I II II I I II I I II II II II I I II I I II 

Db 2413 CTGGACCTCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCC 2472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

III I I I I I I I I II I I I I I I II II II I I 

Db 2473 T T GGAGGAGAT GGG CAAGAGT GAGAT GCTGGTGGCTGT GGC CAC C GAC G GGGACT G CT GA 2532 
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AY411749 2532 bp DNA linear GSS 12-DEC-2003 

Mus musculus HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411749 

AY411749.1 GI: 39767717 
GSS. 

Mus musculus (house mouse) 



ORGANISM Mus mus cuius 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
REFERENCE 1 (bases 1 to 2532) 

AUTHORS Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P. , Ke jariwal, A. , 

Todd, M. A. , Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 

Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 

Adams, M.D. and Cargill,M. 
TITLE Inferring nonneutral evolution from human- chimp-mouse orthologous 

gene trios 

JOURNAL Science 302 (5652), 1960-1963 (2003) 
PUBMED 14671302 
REFERENCE 2 (bases 1 to 2532) 

AUTHORS Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2532 

/organism="Mus musculus" 
/mol_type="genomic DNA" 
/db_xref="taxon: 10090" 
gene <1. .>2532 

/locus_tag="HCM4327" 

ORIGIN 



Query Match 28.4%; Score 780.4; DB 29; 

Best Local Similarity 60.1%; Pred. No. 6.3e-123; 
Matches 1515; Conservative 0; Mismatches 876; Indels 



Length 2532; 

129; Gaps 



8; 



Qy 



Db 



352 GAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATAC 411 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 GAG GT G CAGAT C GAGGTGT CAC GGCAGCAAGT G GAG GAACTCT T C GGGCT CGAGGAC T AC 72 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



412 T GGT GC C AGTG C GT G GCAT GGAGCT C CT C GGGC AC CACCAAGAGT C AGAAGG C CTACAT C 471 
I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

73 TGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGTCGCCGAGCCTACATC 132 

472 C GCAT AGC CAGATT GC GCAAGAACTT CGAGCAGGAGCCGCTGGCCAAGGAGGT GT CC CT G 531 

I I I I I Ml I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I II II 

133 CGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCCAAGGAGGTACCCTTG 192 

532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

193 GAT CAT GAGGT C CT T CT GC AGT G C C GC CCACC GGAGGGAGT GC CT GT GG CT GAG GT G GAA 252 

592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I 

253 T GG CT CAAGAAT GAAGAT GT CAT T GAC C C C G C T C AG GACACT AACT T C CT G CT CAC CAT T 312 



Qy 



652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 313 GACCACAACCTCATCATCCGCCAGGCGCGCCTCTCAGACACGGCCAACTACACCTGTGTG 372 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGT^C 771 

I I I I I I I I I I I I I I I I I I I I I III II I II I I I I I II I I I I I I I I I I 

Db 373 GC CAAGAAT AT C GT GG C CAAGC GC C GGAGCAC C AC GG C CACAGT CAT CGT CTAT GT GAAT 432 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I I 

Db 4 33 GGAGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGTTCCAATCGCTGTGGCCGAGGCTGG 4 92 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

I I I I I II I I II I I I I I I I I I I II II II I I I I I II I I I I I I I I I I I I I I 

Db 4 93 CAGAAGCGTACTCGGACCTGCACCAATCCAGCCCCACTCAATGGAGGCGCCTTCTGTGAG 552 

Qy 892 GGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGC 951 

II III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I 

Db 553 GGACAGGCCTTCCAGAAGACAGCTTGCACCACCGTGTGCCCAGTGGATGGAGCGTGGACC 612 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I 

Db 613 GAGT GGAGCAAGT GGT CTGCCT GCAGCACAGAGT GT GC GCACT GGCGCAGCCGCGAGT GC 672 

Qy 1012 T CT GAC C C AGC AC C C C G C AAC GGAG GGGAG GAGT GC C AG G G C ACT GAC CT GGAC AC C C GC 1071 

I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

Db 673 ATGGCACCGCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTACTTGACTCCAAG 732 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGAC 1119 

I I I I I I I II I I I I I I I II I I I I I 

Db 733 AACTGCACTGATGGGCTGTGCGTGCTGAATCAGAGAACTCTAAACGACCCTAAAAGCCAC 792 

Qy 1120 GTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGC 1158 

I I I I I I I I I I Mill II I III 

Db 7 93 CC C CT GGAGACAT C GG GAGAT GT G GCACTGT ACG C AGG C CT T GT GGT GGCCGTCTTTGTG 852 

Qy 1159 CTGGTCCTGCTGCTGCTTGTCCT CATC CTCGTTT ATT GCCGGAAGAAGGAGGGGCTG 1215 

I M I I I II I I I I I I I I I I I I I I I II I 

Db 8 53 GTGGTAGCGGTTCTCATGGCCGTGGGAGTGATCGTATACCGGAGAAACTGCCGGGACTTC 912 

Qy 1216 GACT CAGAT GT GGCT GACT C GT C CAT T CT CAC CT C AG GCT T C CAGC C C GT C AG CAT C 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 913 GACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTCCACCCTGTCAACTTC 972 

Qy 1273 AAGCCCAGCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGC 1326 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 973 AAGACTGCAAGGCCCAACAACCCGCAGCTCCTGCACCCGTCCGCCCCTCCAGACCTAACG 1032 

Qy 1327 AC CAC CAC CAC CAC C T AC CAGG GC AGT CTCTGTCCCC G GC AGGAT GG 1373 

III I I I I I I I I II I I I I I I I I I I I I I 
Db 1033 GCCAGTGCTGGCATCTACCGCGGGCCTGTGTATGCCCTGCAGGACTCCGCCGACAAGATC 1092 

Qy 1374 GCCCAGCCCCAAGTTCCAGCTCACCAAT 1401 

I I I I I I I I I I I I II II I I II 
Db 1093 CCCATGACTAATTCGCCCCTGCTGGATCCCCTGCCCAGCCTCAAGATCAAGGTCTATAAC 1152 

Qy 14 02 GGGCACCTGCTCAG CCCCCTGGGTGGCGGC 1431 

I III I I I I I I I I I I I 

Db 1153 TCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGACCTGCTGGGTGTCCTC 1212 



Qy 14 32 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 1491 

II I I I I I I I I I I I I I I I I I III 

Db 1213 CCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTCCTGCACCTGCGCAGT 1272 

Qy 14 92 TCCACCCAGAACT ACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

III II I M I I I I I I I I I I I I I I I I II I I I 

Db 1273 GCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCCAGCAGCAGTGTCAGC 1332 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I 

Db 1333 GGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCTCCCCGGCACAGGGGTCAGCCTGTTG 1392 

Qy 1606 AT C C C C CCAGAT G C CAT AC C C C GAGGGAAGAT CTAT GAGAT CT AC CT C AC GCTGC ACAAG 1665 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 1393 GTACCAAAT GGAGCCATT CCCCAGGGCAAGT T CTAT GACCTGTATCTACATATCAACAAG 1452 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I M I I II III I I I I I I I I I I II I I I I I 

Db 14 53 GCCGAAAGCACCCTCCCACTTTCAGAAGGTTCCCAGACAGTATTGAGCCCCTCGGTGACC 1512 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 17 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1513 TGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACCGTGCCCCACTGTGCT 1572 

Qy 17 86 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

M I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1573 GAAGTCATCGCTGGAGACTGGATCTTTCAGCTCAAGACCCAGGCCCATCAGGGCCACTGG 1632 

Qy 18 4 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I 
Db 1633 GAGGAGGTGGT GACCTTGGATGAGGAGACC CT CAACACACCCT GCTACT GCCAGCTGGAG 1692 

Qy 19 06 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Ml I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1693 GCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTACCTACGTATTCATGGGCGAGTCC 1752 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I MM I I I I I I Ml I I II I I I 

Db 1753 TACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCCCCAGCCCTCTGCACC 1812 

Qy 202 6 T C C CT C GAGT AC AAC AT C C GGGT CT AC T GC CT G CAT GAC AC C C AC GAT GC ACT C AAGGAG 2085 

I I M I 1 II I I I I II I II I I I I I M I I I I II I I I I I I I II I I I I II I 
Db 1813 T C C CT G GAGT AT AG C C T CAGGGT CT ACT GT CT GGAGGAC ACAC CT GTAGCACT GAAG GAG 1872 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

M I I I I I I I II II I II I II I I I III I I I II II | || | | 

Db 1873 GTCCTGGAGCTGGAGAGGACTCTGGGTGGCTACTTGGTGGAGGAGCCCAAGCCTTTGCTC 1932 

Qy 2146 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 

I I M M M M II II II I II I M II I II I II II I I II I I II Ml I I I 

Db 1933 T T T AAG G AC AGT T AC C AC AAC C T AC GCCTCTCCCTC CAT GAC AT C C C C CAT G C C C AC T G G 1992 

Qy 2206 AAG AGT AAG CTCCTTGT C AG C T AC C AG GAGAT C C C C T T T TAT C AC AT C T G G AAT G G C AC G 2265 

I I M M M M I II I I II I I I M I I Mill II III I II II I I I I II I 
Db 1993 AGGAGCAAACT ACT GG C CAAGTAC CAG GAGAT T C C CT T CT ACCAC GT CT G GAAT GG CAGC 2052 



Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I III II I 

Db 2 053 CAGAGAGCCCTGCACTGCACTTTCACCCTGGAGAGGCATAGCCTGGCCTCCACGGAGTTC 2112 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 

Db 2113 ACCT GT AAGGT CT GC GT GC GGC AGGT C GAAGGG GAAGGCCAGAT T T T C CAGCT GCACACA 2172 

Qy 2386 AACATCACC AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 2442 

I I I I I I III II II I I I 

Db 2173 ACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCTGCCCCGGGCAATGCC 2232 

Qy 24 4 3 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

Ml I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
Db 2233 AT C AC C AC C C AG C T G G G AC C C T AT G C C T T C AAG AT AC C C C T GT C CAT C C G C C AAAAG AT C 2292 

Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 93 TGCAGCAGCCTGGACGCCCCCAACTCCCGGGGCAACGACTGGAGGCTGTTGGCGCAGAAG 2352 

Qy 2563 CT C CAC CT GGAC AGC C AT CT C AGCT T CT T T GC CT C CAAGC C C AGC C C C AC AGC CAT GAT C 2622 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I IN 

Db 2353 CTGTCCATGGACCGGTACCTAAACTACTTCGCCACCAAAGCTAGTCCCACAGGTGTCATC 2412 

Qy 2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I II 

Db 2413 TTAGACCTCTGGGAAGCTCGGCAACAGGATGACGGGGACCTCAACAGCCTGGCCAGTGCC 2472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

IN I I I I I I I I II I II I I I I I I I I 

Db 2473 T T GGAG GAGATG GGCAAGAGT GAGAT G CT GGT AGC CAT GGC CACAGAT G GC GATT GCT GA 2532 



RESULT 8 
BI758231 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



BI758231 1034 bp mRNA linear EST 25-SEP-2001 

603029876F1 NIH_MGC_114 Homo sapiens cDNA clone IMAGE : 5200171 5', 
mRNA sequence. 
BI758231 

BI758231.1 GI:15749809 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1034) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r @mail . nih . gov 

Tissue Procurement: Life Technologies, Inc. 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 



http : // image . llnl . gov 

Plate: LLAM11501 row: g column: 20 
High quality sequence stop: 793. 
FEATURES Location/Qualifiers 
source 1 . . 1034 

/organism="Homo sapiens" 
/mol_t ype= "mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 5200171" 
/lab_host="DH10B" 
/clone_lib="NIH_MGC_114" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 6 
male brains, age range 23-27 yo. Library is oligo-dT 
primed and directionally cloned (EcoRV site is destroyed 
upon cloning). Average insert size 1.5 kb, insert size 
range 1-3 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 019. Note: 
this is a NIH_MGC Library." 

ORIGIN 



Query Match 27.9%; Score 768.6; DB 12; Length 1034; 

Best Local Similarity 91.2%; Pred. No. 4.3e-121; 

Matches 918; Conservative 0; Mismatches 74; Indels 15; Gaps 9; 



Qy 


150 


GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 


209 


Db 


1 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 


60 


Qy 


210 


CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 


269 






1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 


120 


Qy 


270 


CAAGTGCAAC GGGGAGT GGGT GCGCCAGGT GGACCAC GT GAT CGAGCGCAGCACAGACGG 


329 






M 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


121 


CAAGTGCAAC GGGGAGT GGGT GCGCCAGGT GGAC CACGTGATCGAGCGCAGCACAGAC GG 


180 


Qy 


330 


GAG C AGT GGGCTGCC C AC CAT GGAG GT C C GCAT T AAT GT CT CAAGGC AGC AG GT C GAGAA 


389 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


GAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAA 


240 


Qy 


390 


GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 


449 






M M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | | M | | | | | | | | | | | | | | | | | | | 




Db 


241 


GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 


300 


Qy 


450 


CAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCC 


509 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CAAGAGT CAGAAGGCCT ACAT C C GCAT AGC CTAT T T GC GCAAGAACT T CGAGCAG GAGC C 


360 


Qy 


510 


GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 


569 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 


420 


Qy 


570 


CATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGA 


629 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


CAT C CCT C C AG C C GAG GT GGAGT GG CT C CGGAAC GAGGAC CT GGT GGAC CC GT C C CT GGA 


480 



Qy 630 CC C CAAT GT AT AC AT C AC G C GG GAGCACAGC CT GGT G GT GCGACAGG C CCGCCTTGCT GA 689 

I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 481 CCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGA 540 



Qy 690 CACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGC 749 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 541 C AC G G AC AAC T AC AC CTGCGTGGC C AAG AAC AT C GT G G C AC GT C G C C G C AG CGCCTCCGC 600 

Qy 750 TGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGA-CGTGGACCGAGTGGTCCGTCTGCA 808 

I Mill I II I I II I I II II I I II II I II I I I I I II I M I M I I I I I I I 

Db 601 TGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACCGTGGACCGAGTGGTCCGTCTGC- 659 

Qy 8 09 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I II I I I I II I I I I I II I II I I II I I II II I I I I I || || | || Mill 

Db 660 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACCGGAGCCGGAGCTGCACAACCCGGTGCCTC 719 

Qy 869 TCAACGGGGGCGCTTTCTGTGA-GGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTG 927 

I I M I II II I II I I M I I II M II II II II I II II I I I M I I II I II I I 

Db 720 TCAACGGGGGCGCTTTCTGTGAGGGGGCAGAATGTCCAGAAAGCAGC TGCGCCACCT 776 

Qy 928 TGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGT — GGGCTGGACT 985 

Mill I I I I I I II I II III I I II II I I II I M M II I M I I II III I 
Db 777 GTGCCAGTGGACGGCAGCTGTAGCACGTGGAGCCAGTGGTCGGCCTGTTGGGCTTGGCTT 836 

Qy 986 GCACCCACT — GGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGA 1043 

I II I I I II I I I I II I II II I I I II I I II I II I II I I II I I 

Db 837 GCACCCACTTGGGCGGAGCCGGAGTGCTCTGAACCCAGCACCCCGGCACGGCAGGGGGAG 8 96 

Qy 1044 GTG CCAGGGCACT GAC CT GGACACC CGCAACT GT ACCAGT GACCT CT GT GTACACAG 1100 

Ml I II I I I I I I I I I I I I I I I III II I II I I I II II I II I I I 
Db 8 97 GTGTGCCCAGGTCACTGGACCTGGCACCCGGGA-TGGTCCAGTGAGCTCTGTGT-CCCAC 954 

Qy 1101 TGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCG 1147 

I II I I II I I I I I II I M I I I II I II I II I II I M II II I I 
Db 955 GGGTTCTGGCCCTGAGGACTTGGCCTCCTATGTGGGCCTCATCCCGG 1001 



RESULT 9 
BC033727 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



BC033727 1532 bp mRNA linear HTC 19-NOV-2003 

Homo sapiens netrin receptor Unc5hl, mRNA (cDNA clone 
IMAGE: 5166762 ) , containing frame-shift errors. 
BC033727 

BC033727. 1 GI:21707230 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1532) 

Strausberg, R.L. , Feingold, E. A. , Grouse^L.H. , Derge, J.G. , 
Klausner, R. D. , Collins , F. S . , Wagner, L., Shenmen, C .M. , Schuler,G. 
Altschul,S.F., Zeeberg,B., Buetow, K. H. , Schaef er, C . F. , Bhat,N.K. 
Hopkins, R. F. , Jordan, H., Moore, T., Max,S.I., Wang, J. , Hsieh,F., 
Diatchenko,L. , Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Staple t on, M. , Soares ,M. B. , Bonaldo,M. F. , Casavant , T . L . , 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



Scheetz,T.E. , Brownstein,M. J. , Usdin, T.B. , Toshiyuki, S. , 
Carninci,?., Grange, C, Raha,S.S., Loquellano, N . A. , Peters , G. J ., . 
Abramson,R.D. , Mullahy, S . J. , Bosak,S.A., McEwan,P.J., 
McKernan f K • J . , Malek,J.A., Gunaratne, P . H . , Richards , S . , 
Worley,K.C, Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
Villalon,D.K. , Muzny, D .M. , Sodergren, E . J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M., Madan,A., Rodrigues , S . , 
Sanchez, A., Whiting, M. , Madan,A., Young,A.C, Shevchenko, Y. , 
Bouf fard,G.G. , Blakesley, R.W. , Touchman, J. W. , Green, E.D., 
Dickson, M.C. , Rodriguez, A. C . , Grimwood, J. , Schmutz, J. , Myers, R.M. , 
Butterfield, Y.S. , Krzywinski,M. I . , Skalska,U. , Smailus, D. E. , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 1532) 
Strausberg, R. 
Direct Submission 

Submitted ( 02- JUL-2 002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter,N. , Ayele,K. , Beckstrom-Sternberg, S .M. , Benjamin, B. , 
Blakesley, R.W. , Bouf f ard, G . G . , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N.L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q.L., Masiello,C, Maskeri,B., Mastrian, S . D . ,McCloskey, J. C . 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas, P. J., Touchman, J. W. 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 68 Row: i Column: 2 

This clone was selected for full length sequencing because it 
passed the following selection criteria: GenomeScan gene prediction 
This clone has the following problem: frame shifted. 
FEATURES Location/Qualifiers 
source 1. .1532 

/organism="Homo sapiens" 

/ mo 1 _ t y p e = " mRN A " 

/db_xref="taxon: 9606" 

/clone="IMAGE: 5166762" 

/tissue_type="Brain, adult medulla" 



/clone_lib- ,, NIH_MGC_119" 
/lab_host="DHlOB" 
/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 26.8%; Score 736.6; DB 11; Length 1532; 

Best Local Similarity 84.2%; Pred. No. 1.5e-115; 

Matches 917; Conservative 0; Mismatches 4; Indels 168; Gaps 1; 

Qy 337 GGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTC 396 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I 
Db 612 GGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTC 671 

Qy 397 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 672 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 731 

Qy 457 CAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCC 516 

I I I I I I I I I II I I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 732 CAGAAGGCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCC 791 

Qy 517 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 57 6 

I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 

Db 792 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 851 

Qy 577 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 852 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 911 

Qy 637 GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 912 GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 971 

Qy 697 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 972 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 1031 

Qy 757 ATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGC 816 
I I I I I I I I I I I I 

Db 1032 ATCGTCTACGTG 1043 

Qy 817 TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 876 

Db 1044 1043 

Qy 877 GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 936 

Db 1044 1043 

Qy 937 GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 996 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1044 GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 1103 

Qy 997 CGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT 1056 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1104 CGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT 1163 



Qy 1057 GACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAG 1116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i 
Db 1164 GACCTGGACACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCTGAG 1223 

Qy 1117 GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 1176 

1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 122 4 GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 1283 

Qy 117 7 GTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCG 1236 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | 
Db 1284 GTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCG 1343 

Qy 1237 T C CAT T CT CAC C T CAG GCT T C C AGCC CGT C AGC AT CAAGC CCAGCAAAGCAGACAAC CC C 1296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1344 TCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCC 14 03 

Qy 1297 CAT CT G CT CAC CAT C C AGC C G GAC CT CAG CAC CAC CAC CAC CAC CT AC CAGGGC AGT CT C 1356 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1404 CAT C T G CT CAC CAT C C AGC C GGAC CT CAGC AC CAC CAC CAC CAC C T AC CAG G GC AGT CT C 14 63 

Qy 1357 TGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGC 1416 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1464 TGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGC 1523 

Qy 1417 CCCCTGGGT 1425 

I I I I I I I I I 
Db 1524 CCCCTGGGT 1532 



RESULT 10 

AI951556 

LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



AI951556 788 bp mRNA linear EST 09-MAR-2000 

wv36f04.xl NCI_CGAP_Ovl8 Homo sapiens cDNA clone IMAGE: 2531647 3' 
similar to TR: 008721 008721 TRANSMEMBRANE RECEPTOR UNC5H1 . mRNA 
sequence . 
AI951556 

AI951556.1 GI:5743866 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 788) 

NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap. 
National Cancer Institute, Cancer Genome Anatomy Project 
Tumor Gene Index 
Unpublished (1997) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Christopher A. Moskaluk, M.D., Ph.D., 
R. Emmert-Buck, M.D., Ph.D. cDNA Library Preparation: M. 
Soares, Ph.D. cDNA Library Arrayed by: Christa Prange, The 
I.M.A.G.E. Consortium DNA Sequencing by: Washington University 
Genome Sequencing Center 

Clone distribution: NCI-CGAP clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
www-bio . llnl . gov/bbrp/image/image . html 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



(CGAP) , 



, Michael 
Bento 



FEATURES 

source 



Insert Length: 1125 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 446. 

Location/Qualifiers 

1. .788 

/ organism="Homo sapiens" 

/rnol_type="mRNA" 

/db__xref="taxon: 9606" 

/clone="IMAGE: 2531647" 

/tissue_type="fibrotheoma M 

/lab_host="DH10B (phage-resistant ) " 

/clone_lib="NCI_CGAP_Ovl8" 

/note="Organ: ovary; Vector: pT7T3D-Pac (Pharmacia) with a 
modified polylinker; Site_l: Not I; Site__2 : Eco RI; 1st 
strand cDNA was primed with a Not I - oligo(dT) primer [5' 
TGTTACCAATCTGAAGTGGGAGCGGCCGCGCGACATTTTTTTTTTTTTTTTTT 3 1 ] ; 
double-stranded cDNA was ligated to Eco RI adaptors 
(Pharmacia), digested with Not I and cloned into the Not 
I and Eco RI sites of the modified pT7T3 vector. Library 
went through one round of normalization, and was 
constructed by Bento Soares and M. Fatima Bonaldo. 



ORIGIN 



Query Match 26.7%; 
Best Local Similarity 96.5%; 
Matches 74 9; Conservative 



Score 735.2; DB 9; 
Pred. No. 1.9e-115; 
0; Mismatches 27; 



Length 788; 
Indels 0; 



Gaps 



0; 



Qy 1469 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 1528 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCGAGGAGTTCGTCTCCCGCCTCTCCGCCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 60 



Qy 

Db 

Qy 

Db 



1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 158 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 120 

158 9 CAGGTATCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCT 1648 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CAGGAAT C AGCCT C CT C AT C CC C C CAGAT GC CAT AC C C C GAGGGAAGAT CT AT GAGAT CT 18 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



164 9 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 17 08 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC CT CACG CT GC ACAAGC C GGAAGACGT GAGGTT G C C C CT AGCT GG CT GT CAGAC C CTG C 240 



181 



1709 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1768 
I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTTCTGCTCACCCGGCCAGTCATCCTGG 300 



241 



1769 CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 1828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 360 



301 



1829 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 188 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 420 



Qy 1889 



ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 194 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



Db 



421 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGCTATG 4 80 



Qy 194 9 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 2 008 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 

Db 481 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 540 

Qy 2 009 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCC 2 068 

I i I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATACTGGTCTACTGCCTGCATGACACTC 600 

Qy 2 069 ACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGG 2128 

I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AC GAT G CACT CAACGT AGT GGT GCAGCT GGAGAAGC AGCT G C AGGGAC AG CT GAT C C AGG 660 

Qy 212 9 AGCCACGGGTCCTGCACTTCAAGGACAGTTACCAC7VACCTGCGCCTATCCATCCACGATG 2188 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 AGC CACT GGTACT GCACTTCAAGGACAGTTACCACAACCTGCGCCTATNCAT CCAC GATG 72 0 

Qy 2189 TGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTT 2244 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 721 TGCCCAGCTNCCNTGTGGAGAGTAAGCTTCTTGTCAGCTACCCAGAGATCCNCTAT 776 



RESULT 11 

BX348193/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BX348193 843 bp mRNA linear EST 05-MAY-2003 

BX34 8193 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB008YE02 5-PRIME, mRNA sequence. 
BX348193 

BX348193. 1 GI:30367258 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chorda ta; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 843) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 3239. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster. cgi?seq=CS0BAF004ZD01_AF00293_l&cluster=3239. r . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0BAF004ZD01_AF00293_1 . 

Location/Qualifiers 

1. .843 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone-"CS0DB008YE02" 



/tissue_type="NEUROBLASTOMA COT 10 -NORMAL I ZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10 -NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.3%; Score 722.8; DB 13; Length 843; 

Best Local Similarity 95.3%; Pred. No. 2.6e-113; 

Matches 776; Conservative 0; Mismatches 34; Indels 4; Gaps 3; 

Qy 1653 CAC G CT GC ACAAG C C GGAAGAC GT GAG G — TTGCCCCTAGCTGGCTGTCAGACCCTGCTG 1710 

I I I I I M II I I I I I I I III I IN I I I I I I I I I I I I I I I I I I I 

Db 824 CACGCGGCCAAAAGCGGAAGAGTGTAGGGTTGCCCCAAACCGGGCTGTCAGACCCTGTTG 765 

Qy 1711 AGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCT 177 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 764 AGTCCCATGGTTAGCTGTGAA-CCCCTGGCGTCCTGCTCACCGGCCCAGTCATCCTGGGT 7 06 

Qy 1771 ATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTC-AAAAAGCAGTC 1829 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 705 ATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGAGGCCTGCGCCTCAAAAAAACAGTC 64 6 

Qy 1830 GTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTA 1889 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I 

Db 645 GTGCGAGGACAGCTGGGAGTATGTCCTGCACCTGGGCGAGNAGGCGCCCTCCCACCTCTA 586 

Qy 1890 CTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGC 1949 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 585 CTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGC 526 

Qy 1950 CCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGC 2009 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 525 CCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGC 4 66 

Qy 2010 GCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCA 2069 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 65 GCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCA 406 

Qy 2 07 0 CGAT GC ACT CAAG GAGGT G GT GCAGCT G GAGAAGCAG CT G GG GGGAC AG CT GAT C CAGGA 212 9 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I II II I I I I I I I I I 
Db 4 05 C GAT G CACT CAAGGAGGT G GT GCAGC T GGAGAAGCAGCT G GG GGGACAGC T GAT C CAGGA 34 6 

Qy 2130 GCCACGGGT C CT GCACTT CAAGGACAGTTACCACAACCT GCGCCTAT CCAT C CACGAT GT 2189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 345 GCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGT 286 

Qy 2190 GC C C AGC T C C CT GT G GAAGAGT AAGCT C CTT GT C AGCT AC C AGGAGAT C C C C T T T TAT C A 2249 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I II I II II I I 
Db 285 GCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCA 226 

Qy 2250 CATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCC 2309 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 225 CATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCC 166 



QY 



2310 



CAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAG 2369 







1 1 M 1 i 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 


165 




Qy 


2370 


C T T CAGC AT CAACTT CAAC AT CAC CAAGGACACAAGGT T T GC T GAGCT GCT GGCT CT GGA 242 9 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 


Db 


105 


CTTCAGCATCAACTTCAACATCACCT^lGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGA 4 6 


Qy 


2430 


GAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCC 2463 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 || Ml 


Db 


45 


GAGTGAAGCGGGGGTCCCAGNCCCTGGTGGGCCC 12 



RESULT 12 

BI818609 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BI818609 818 bp mRNA linear EST 04-OCT-2001 

603033362F1 NIH_MGC_115 Homo sapiens cDNA clone IMAGE : 5174559 5', 
mRNA sequence. 
BI818609 

BI818609.1 GI: 1592 9902 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 818) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 

Plate: LLAM11434 row: 1 column: 16 
High quality sequence stop: 744. 

Location/Qualifiers 

1. .818 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 5174559" 
/lab_host="DH10B" 
/clone_lib-"NIH_MGC_115" 

/note="Organ: pooled brain, lung, testis; Vector: 
pCMV-SPORT6; Site_l: NotI; Site_2 : EcoRV (destroyed); RNA 
source anonymous pool of 6 male brains, age range 23-27; 1 
male lung, age 27; and 1 male testis, age 69. Library is 
oligo-dT primed and directionally cloned (EcoRV site is 
destroyed upon cloning). Average insert size 1.8 kb, 
insert size range 1-3 kb. Library is normalized and 
enriched for full-length clones and was constructed by C. 
Gruber (Invitrogen) . Research Genetics tracking code 
021. Note: this is a NIH_MGC Library." 



ORIGIN 



Query Match 26.0%; Score 716.4; DB 12; Length 818; 

Best Local Similarity 97.7%; Pred. No. 3.2e-112; 

Matches 748; Conservative 0; Mismatches 16; Indels 2; Gaps 2; 

Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C C GGAC CT GCT T C C C C AC T T C CT GGT GGAG C C C GAGGAT GT GT AC AT C GT C AAGAAC AAG 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAG 180 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 24 0 

Qy 283 GAGT GGGTGC GCCAGGT GGACCAC GT GAT CGAGCGCAGCACAGAC GGGAGCAGT GGGCT G 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GAGTGGGTGCGCCAGGT GGACCAC GT GAT CGAGCGCAGCACAGACGGGAGCAGT GGGCTG 300 

Qy 343 CCC ACCATGGAGGT C C GCATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT G 402 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 301 CCCACCATGGAGGTCCGCATTAATGTCTCT^GGCAGCAGGTCGAGAAGGTGTTCGGGCTG 360 

Qy 403 GAG GAAT ACT G GT GC C AGT G C GT G GC AT GGAGCT C CT C GG G CAC C AC CAAGAGT C AGAAG 462 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAG GAAT ACT GGT GC CAGT G C GT G GC AT G GAGCT C CT C GGGCAC CAC CAAGAGT CAGAAG 420 

Qy 463 GCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 522 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I 
Db 421 GCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 

Qy 583 GAG GT G GAGT G GCT C C GGAAC GAGGAC CT GGT GGAC CCGTCCCTG GAC C C C AAT GT AT AC 642 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 541 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTC-GCCGCAGCGCCTCCGCTGCTGTCATCGT 761 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCAGCCGCAGGGCCTCCGCTGCTGTCATCGT 720 

Qy 762 CTACGTGAACGGTGGGTGGTCGACG-TGGACCGAGTGGTCCGTCTG 806 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 721 CTACGTGGACGGCAGCTGGAGCCCGTTGGAGCCAGTGGTCGGGCTG 766 



RESULT 13 

BX364574 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX364574 909 bp mRNA linear EST 05-MAY-2003 

BX364574 Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED Homo sapiens 
cDNA clone CS0DC023YB10 5-PRIME, mRNA sequence. 
BX364574 

BX364574.1 GI: 30368812 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia; Eutheria; 
1 (bases 1 to 909) 
Li, W. B. , Gruber, C. , 



FEATURES 

source 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Primates; Catarrhini; Hominidae; Homo. 



and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 3529. f For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster. cgi?seq=CSlAC006ZF06QPl&cluster=3529. f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS1AC006ZF06QP1 . 

Location/Qualifiers 

1. .909 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DC023YBl0" 

/ tissue_type= "NEUROBLASTOMA COT 2 5 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 25. 1%; 

Best Local Similarity 99.0%; 
Matches 7 03; Conservative 



Score 692; DB 13; Length 909; 
Pred. No. 5.1e-108; 
3; Mismatches 3; Indels 1; 



Gaps 



1; 



Qy 



Db 



1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 
I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 01 CCGCRGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 260 



Qy 



Db 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 320 



Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 18 0 



Db , 321 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCYAACCCGGACCTGCTTCCCCAC 380 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 381 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 44 0 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 441 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 500 

Qy 301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

I I II I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 501 G AC C AC GT GAT C GAG C G C A- SAC AG AC G G GAG C AGT GGGCTGCC C AC CAT G GAG GT C C G C 559 

Qy 361 AT T AAT GT CT CAAGG C AGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT ACT G GT G C CAG 42 0 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 560 AT T AAT GT CT CAAGGC AGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT G GTG C CAG 619 

Qy 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 620 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 679 

Qy 4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 680 TATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 739 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 740 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 799 

Qy 601 AAC GAGGAC CT G GT GGACC CGT C C C T GGAC C C CAAT GT ATACAT CACGC GGGAGCAC AG C 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 800 AAC GAGGAC CT G GT GGAC C CGT C C CT GGACC C CAAT GT ATACAT CACGCGGGAGCACAG C 859 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 710 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 860 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 909 



RESULT 14 

AY411748 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AY411748 2532 bp DNA linear GSS 12-DEC-2003 

Pan troglodytes HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411748 

AY411748.1 GI: 39767716 
GSS . 

Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan. 
1 (bases 1 to 2532) 

Clark, A. G., Glanowski , S . , Nielson,R., Thomas, P., Ke jariwal , A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 
ORIGIN 



Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 
2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



to 2532) 

Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B. , 
, Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 



Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2532 

/organism-" Pan troglodytes" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9598" 
<1. .>2532 

/locus_tag= ,, HCM4 327" 



Query Match 24. 6%; 

Best Local Similarity 54.4%; 
Matches 1370; Conservative 



Score 678.2; DB 29; 
Pred. No. 1.9e-105; 
0; Mismatches 1021; Indels 



Length 2532; 

129; Gaps 



9; 



Qy 



Db 



352 GAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATAC 411 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

13 GAGGTGCAGATCGAGGTGTCGCGGCAGCAGGTGGAGGAGCTCTTTGGGCTGGAGGATTAC 72 



Qy 

Db 

Qy 

Db 

Qy 

Db 



412 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 471 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

73 TGGTGCCAGTGCGTGGCCTGGAGCTCTGCGGGCACCACCAAGAGTCGCCGAGCCTACGTC 132 

472 C GCAT AG C CAGAT T GC G C AAG AACT T C GAG C AGGAGC C GCT GGC CAAG GAG GT GT C C CT G 531 
I I I I I II I 

133 CGCATCGCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 192 

532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

I I I I I 

193 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN GT GGAA 252 



Qy 

Db 

Qy 

Db 

Qy 

Db 



592 



253 



652 



TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 
I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I 

T GGCT CAAGAAT GAGGAT GT CAT C GAC C C CAC CC AGGACAC CAACT T C CT GCT C AC CAT C 



651 



312 



711 



GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 
II I I II III I I II I I I I I I I I I I I I I I I I I MINIM I I I I I I I I I 
313 GACCACAACCTCATCATCCGCCAGGCCCGCCTGTCGGACACTGCCAACTATACCTGCGTG 372 

712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

I I I I I I I I I I I I I I I I I I I I I I III II I II I I I I I I I I I I I I I I I I I I 

373 GC CAAGAACAT C GT GGC CAAAC GC C GGAGCAC CAC TGC CAC C GT CAT C GT CTAC GT GAAT 432 



Qy 



772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 
M M II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCGCCCTGCTCCAACCGCTGTGGNNGANNCTGG 4 92 



Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 8 91 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 93 CAGAAGCGCACCCGGACCTGCACCAACCCCGCCCCACTCAACGGAGGGNNNNTCTGCGAG 552 

Qy 892 GGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGC 951 

MM I II II I I M 

Db 553 GGCCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCGATGGGGCGTGGACG 612 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I II I I I II II I II II II I I I I II II II II I II II I I I I M I I M I I 

Db 613 GAGTGGAGCAAGTGGTCAGCCTGCAGCACTGAGTGTGCCCACTGGCGTAGCCGCGAGTGC 672 

Qy 1012 TCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGC 1071 

I I I I I I II I I II I II I I I I I M II II I I M I I 

Db 673 ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 

Qy 1072 AACT GT ACCAGTGACCT CTGT GT ACACAGT GCTT CT 1107 

M II I I I I I M I I I I I I I 

Db 733 AACT GCAC AGAT GG GCT GT GCAT GCAAAAT AAGAAAACT CT AAGC GAC C C CAACAGC CAC 7 92 

Qy 1108 GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 1155 

I I I I I II I M I I I I I M I I I I II I I I I I I II 

Db 793 CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCGTCTTCNTG 852 

Qy 1156 TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1215 

I I II I II II M I I I I I I M II I I I I 

Db 853 GTCNTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 912 

Qy 1216 GAC T C AG AT G T G G C T GAC T C G T C CAT T CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1272 

I II II M I II II I II II I MM II I I I II II I II I I I i 

Db 913 GACACAGACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTT 972 

Qy 1273 AAGCCCAGCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGC 1326 

Ml I I I I I I I I I I ! II I I II II I I M I I I I 

Db 973 AAGACGGCAAGGCCCAGCAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACA 1032 

Qy 1327 AC CAC CAC CAC C AC CT AC C AGGGCAGT CT C TGTCCCCGG C AGGAT GGG 1374 

II I I II II I I M I II I I I I II II I II I 

Db 1033 GCCAGCGCCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATC 1092 

Qy 1375 CCCAGCCCCAAGTTCCAGCTCACCA — 1399 

II I II II I II I I I I II I I 

Db 1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 

Qy 1400 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC ACACA 1440 

I II I I I I I II I I I I I II I I I 

Db 1153 TCCAGCACTACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGAGTCTTG 1212 

Qy 14 41 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

III II I I I I I I II I I M I I I II I I I 

Db 1213 CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 1272 

Qy 1501 AACTACTTCCGCTC C C T GC C C C GAGGCACC AGCAACAT GAC CT AT 1545 

I I I I I II I II I I I I I I II I I III I 

Db 1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGNNAGCAGCGTCAGC 1332 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I II I I I 

1333 GGCACCTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGTCAGCTTGCTG 1392 

1606 AT C C C C C C AGAT GC CAT AC C C C GAGGGAAGAT C TAT GAGAT CT AC CT C AC GC T G C ACAAG 1665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1393 GT GC C CAAT G GAGC C AT T CC C CAGGGCAAGT T CT AC GAGAT GT AT CTACT C AT CAACAAG 1452 

1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I II II II I I I I I I I I I I I I I I I I I 

1453 G C AGAAAG T AC CCTCCCGCTTT C AG AAG G GAC C C AG AC AG TAT T GAG C C C C T C AG T G AC C 1512 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1513 TGTGGACCCACAGGCCTCCTGCTGTGCCACCCCGTCATCCTCACCATGCCCCACTGTGCC 1572 

17 86 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

II III I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GAAGTCAGTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGG 1632 



1573 



184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I 

1633 GAGGAGGT GGT GAC C CT GGAT GAGGAGACC CT GAACACAC C C T G CTACT GC C AGC T GGAG 1692 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 



1966 



1752 



2025 



CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 
I III III I I I I I I I II I I I I I I I I I I 

1753 TATTCCCNNNNNNCAGTCNNNNNGCTCCNGCTGGCCGTCTTNGCCCCTGCCCTCTGCACC 1812 

2026 T CCCT CGAGTACAACAT CCGGGT CTACT GCCTGCAT GACACCCAC GAT GCACT CAAGGAG 2085 

I I I I I I I I I I I II I I I I I I II I I I I III 

1813 TCCCTGGANNNNNGCCTCCGGGTCTACTGCCTGGNNNNNNNNNNNNNNNNNNNNNNNGAG 1872 

2086 GT GGT GCAGCT GGAGAAGCAGCT G G GG G GAC AGCT GAT C C AGGAG C CAC GGGT CCT GCAC 2145 

I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I II 
1873 GT GCT GGAGCT GGAG C GGACT CT G GGC G GAT ACT T GGT G GAGGAG C C GAAAC CGCTAAT G 1932 

214 6 T T CAAGGAC AGT TAC CACAAC CT G C GC CT AT C CAT C CAC GAT GT G CC C AGCT CCCT GT GG 2205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III MM II I III III III 

1933 TTCAAGGACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGG 1992 

2206 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 2265 
I III I I I II II I II I I I I II II I M II II II I I I I II I I I II I II I I 
AGGAGCAAGCTGCTGGCCAAATACCAGGAGATCCCCTTCTGTCACATTTGGAGTGGCAGC 



1993 



2052 



2266 



CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 
III I I I I I I I I II I I II I I I M II II I II I I III II I I 

2053 CAGAAGGCCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTC 2112 

232 6 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I II II I I I I I I I I I II M I M I I I I I I I I I I III I I I 

2113 ACCT GCAAGAT CT GC GT GC G GCAAGT G GAAG G GGAGG GC C AGATAT T C CAGC T GCAT AC C 2172 



Qy 238 6 AAC AT C AC C AAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 24 42 

I I I II III II II I M 

Db 2173 ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 

Qy 2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2233 GTCACCACCCAGCTGGGACCTTATGCCTTCAAGATCCCACTGTCCATCCGCCAGAAGATA 2292 

Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2293 TGCAACAGCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAG 2352 

Qy 2563 C T C C AC CT GGAC AGC C AT CT C AG CTTCTTTGCCTC CAAGC C C AGC C C C ACAGC CAT GAT C 2 622 

III I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I 

Db 2353 CTCTCTATGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATC 2412 

Qy 2 623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 2413 CTGGACCTCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCC 2472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I 1 I I I I I II I I I II I I I I I I I I I 

Db 2 473 TTGGAGGAGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2532 



RESULT 15 

BF311804 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



BF311804 934 bp mRNA linear EST 21-NOV-2000 

601897316F1 NIH_MGC_19 Homo sapiens cDNA clone IMAGE: 4126706 5', 
mRNA sequence. 
BF311804 

BF311804.1 GI: 11259566 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 934) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC 
cDNA Library Preparation: Ling Hong/Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: image.llnl.gov 
Plate: LLCM1016 row: p column: 03 
High quality sequence stop: 7 07. 

Location/ Qualifiers 

1. .934 

/organism="Homo sapiens" 
/mol_jtype="mRNA" 
/db_xref="taxon:9606" 
/clone=" IMAGE: 4126706" 



/tissue_type= !, neuroblastoma" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib= ,, NIH_MGC_19 M 

/note="Organ: brain; Vector: pOTB7; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally 
cloned into EcoRl/XhoI sites using the following 5 1 
adaptor: GGCACGAG ( G) . Library constructed by Ling Hong 
in the laboratory of Gerald M. Rubin (University of 
California, Berkeley) using ZAP-cDNA synthesis kit 
(Stratagene) and Superscript II RT (Life Technologies) . 
Note: this is a NIH_MGC Library." 



ORIGIN 



Query Match 24.4%; Score 672.6; DB 10; Length 934; 

Best Local Similarity 93.3%; Pred. No. l.le-104; 

Matches 7 47; Conservative 0; Mismatches 49; Indels 5; Gaps 4; 

Qy 1116 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 1175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 61 

Qy 1176 T GT C CT CAT C CT C GT T TAT T GC C GGAAGAAGGAG GGGCT GGACT C AGAT GT GGC T GACT C 1235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 121 

Qy 1236 GTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCC 1295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 122 GT CCAT T C T CAC CT CAGGCTT C CAG CC C GT CAGCAT CAAGCC CAG CAAAGCAGAC AACC C 181 

Qy 1296 C CAT CT G C T CAC CAT C C AGC C G GACCT CAGC AC CAC CAC CAC C AC CT AC CAG GGCAGT CT 1355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 182 C C AT CT GCT CAC CAT C C AGCC G GAC CT C AGCAC CAC CAC CAC CAC CTAC CAG GGC AGT CT 241 

Qy 1356 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 1415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 242 C T GT C C C C GGC AGGAT GGGC C CAG C C C CAAGT T C C AG CT CAC C AAT G G GCAC CT GCT CAG 301 

Qy 1416 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 1475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 302 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 361 

Qy 1476 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 1535 

I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 362 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 421 

Qy 1536 CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTAT 1595 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 422 CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAAT 481 

Qy 1596 CAGCCT CCT CAT CCCC CCAGAT GC CAT ACCCCGAGGGAAGAT CTAT GAGAT CT ACCT CAC 1655 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 482 CAG- CTCCT CAT CCC CCCAGAT GCCAT ACCCCGAGGGAAGAT CTAT GAGATCTACCT CAC 54 0 

Qy 1656 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 1715 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCTGCACAAGCCGGAAGACGTGAGGTTG-CCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 599 



Qy 1716 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCC--TGGCTATG 1773 

I I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I II I I I I I I I I I I I I III 
Db 600 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCAACCGGGCAGTCATCCCTGGCTAATG 659 

Qy 1774 GACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGC 1833 

Mil III I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 660 GACCCACTGTGGGG7VAGCCAGCCTGACAGTTGGAGCCTGGGCTCAAAAAGGAGTCGGTGC 719 

Qy 1834 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1893 

I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I 
Db 720 GAGGGCAGCTGGGA-GATGTGCTGGACTGGGGGAAGAAGGGGGCCTCCACCCTCTATTAT 778 

Qy 18 94 TGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I II II 

Db 779 TGGCAGTGGGAGGCAAGGCCC 7 99 



Search completed: July 7, 2004, 16:21:10 
Job time : 6771 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



Searched: 



July 7, 2004, 09:28:21 ; Search time 10430 Seconds 

(without alignments) 
11436.244 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



6940544 



Database 



GenEmbl : * 



1 




gb_ba : * 




2 




gb htg: 


* 


3 




gb in:* 




4 




gb om : * 




5 




gb ov : * 




6 




gb pat: 


* 


7 




gb_ph : * 




8 




gb pi : * 




9 




gb p r : * 




10 


gb ro : 




11 


gb s ts 


: *** 


12 


gb sy : 




13 


gb_un : 




14 


gb_vi : 




15 


em ba : 


* 


16 


em fun 


: * 


17 


em hum: * 


18 


em in: 


* 


19 


em mu : 




20 


em om: 




21 


em or: 




22 


em ov: 




23 


em pat 




24 


em ph: 


* 


25 


emjpl : 


+ 


26 


em ro : 


+ 


27 


em sts 


: * 



28 


em 


un : * 


29 


em 


vi : * 


30 


em 


_htg hum:* 


31 


em 


_htg inv:* 


32 


em 


htg other:* 


33 


em 


htg mus : * 


34 


em 


htg pin:* 


35 


em 


_htg rod:* 


36 


em 


htg mam:* 


37 


em 


htg vrt : * 


38 


em 


sy : * 


39 


em 


htgo hum:* 


40: 


em 


htgo mus : * 


41: 


em 


htgo other:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 
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AY099459 


AY099459 Xenopus 1 



34 
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.6 
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Sequence 


35 


623. 
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22 


.6 
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Sequence 
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.5 
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Sequence 
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17 


.5 


2406 


9 
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Homo sapi 


44 
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8 


17 


.4 
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6 
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Sequence 


45 


478. 


8 


17 


.4 
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6 
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RESULT 1 
AX449572 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



linear PAT 03-JUL-2002 



ALIGNMENTS 



AX449572 2752 bp DNA 

Sequence 1 from Patent WO0210216. 
AX449572 

AX449572.1 GI:21698195 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Padigaru,M., Mezes,P., Mishra,V., Burgess, C, Casman,S., 

Grosse,W.M., Alsobrook, J . P . , Lepley,D.M., Gerlach, V. L . , 

Macdougall, J. R. and Smithson,G. 

Proteins and nucleic acids encoding same 

Patent: WO Q210216-A 1 07-FEB-2 002; 

Curagen Corporation (US) 

Location/ Qualifiers 

1. .2752 

/organism- "Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 100.0%; Score 2752; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 

Db 



1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 
1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 



Qy 

Db 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 



Qy 

Db 



121 
121 



CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 



Qy 181 TTCCTGGTGGAGCCCGAGGATGT.GTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TT CCT GGT GGAGC CC GAGGAT GT GTACAT CGT CAAGAACAAGCCAGT GCT GCTT GT GT GC 240 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

Qy 301 GAC CAC GTGAT C GAG C GCAG CACAGAC GGGAGC AGT GGGCTGCC CAC CAT GGAGGT C CGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GAC CAC GT GAT C GAGC G CAGCACAGAC GG GAGCAGT G GG CT G C C CAC CAT G GAGGT C C GC 360 

Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 42 0 

I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATTAAT GTCT CAAGGCAGCAGGT CGAGAAGGTGT TCGGGCT GGAGGAATACTGGTGCCAG 42 0 

Qy 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 60 0 

Qy 601 AAC GAG GAC C T G GT GGAC CCGTCCCTG GAC C CC AAT GT AT AC AT CAC GC GG GAGC AC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AAC GAGGAC CT GGT GGAC CC GT C C CT G GAC C CCAATGT AT ACAT CAC G CGGGAGCACAGC 660 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | M 
Db 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 72 0 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | | | 
Db 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

Qy 7 81 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 84 0 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 



Qy 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

I I II I I I! I I I I I I I I I 11 I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 10 8 0 

Qy 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 12 01 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 12 60 

Qy 12 61 C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C AC CAT C C AG C C G G AC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 CCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCGGAC 1320 

Qy 1321 CT C AGC AC C AC CAC C AC C AC C T AC CAGG GC AGT CT CT GT C C C C G G C AGGAT G G GC C C AG C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

Qy 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
Db 14 41 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 162 0 

I I 1 1 1 1 I I I i 1 1 1 I I I I I I I I I 1 1 1 1 1 I I I 1 1 1 I I I I 1 1 I I I 1 1 I I I 1 1 1 I 1 1 I I 1 1 1 I I 

Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 162 0 

Qy 1621 AT ACCCC GAGGGAAGAT CT AT GAGAT CTAC CT CACGCT GCACAAGCC GGAAGACGT GAGG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1621 AT AC CC C GAGGGAAGAT CT AT GAGAT CTAC CT CAC GCT GCACAAG CC GGAAGAC GT GAGG 1680 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GT C CT GC T CAC C C GGC C AGT CAT C CT GGCT AT GGAC C ACT GT GG G GAG C C CAGC C CT GAC 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 18 01 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 



Db 



1861 



I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 



1920 



Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 198 0 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 AT CCGGGT CT ACT GCCT GCAT GACACCCAC GAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2041 ATC C GGGT CT ACT GCCT G CAT GAC AC C CAC GAT GCACT CAAGGAG GT GGT GCAGCT GGAG 2100 

Qy 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

I 1 1 I I I I 1 1 1 1 I 1 1 1 II I I I I 1 1 1 I I i 1 1 1 1 1 I I I I I i 1 1 I I I I 1 1 I 1 1 I I I I I I I I 1 1 1 

Db 2101 AAGC AG C T GGG GGGACAGCT GAT C C AGGAGC CAC G GGT CCT G C ACT T CAAG GAC AGT T AC 2160 

Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CACAACCT GC GCCT AT C CAT C CAC GAT GT G C CCAG CT C CCT GT G GAAGAGT AAGCT C CT T 2220 

Qy 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

Qy 22 81 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 234 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

Qy 2341 GTGT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACAT CACCAAGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 GTGT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACCAAGGAC 2400 

Qy 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

1 1 1 I I I I 1 1 i 1 1 I I I I 1 1 I I I 1 1 1 1 1 I 1 1 I I I I 1 1 1 1 I I I 1 1 1 I I I 1 1 I I I 1 1 1 1 1 I 1 1 1 

Db 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

Qy 24 61 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2 640 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 



Result 2 

AX451652 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 
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linear PAT 03-JUL-2002 



AX451652 2697 bp DNA 

Sequence 1 from Patent WO0233080. 
AX451652 

AX451652 . 1 GI: 21698587 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo, 

1 

Koehler, R.H. 

Regulation of human netrin binding membrane receptor unc5h-l 
Patent: WO 0233080-A 1 25-APR-2002; 
Bayer Aktiengesellschaf t (DE) 

Location/ Qualifiers 

1. .2697 

/organism =, 'Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 97.7%; 
Best Local Similarity 99.8%; 
Matches 2691; Conservative 



Score 2687.4; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2 697; 

6; Indels 0; Gaps 



0; 



QY 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 

I I I I I I I I I I I I I I I I 1 I I I I I I I II I I ! I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 

106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 

166 GAC CTGCTTCCC C ACT T C CT G GT GGAGC C C GAG GAT GT GT AC AT C GT CAAGAAC AAGC C A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GAC CTGCTTCCC CACTT C CT GGT GGAGCC C GAGGAT GT GT AC AT C GT CAAGAACAAGCCA 

226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 

286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I Ill 

241 T GGGT G C G C C AGGT G GAC C AC GT GAT C GAGC G C AG C ACAGAC GGGAG CAGT GGGCTGCCC 

346 AC CAT GGAG GT C C G C ATTAAT GT CT CAAG GCAGCAGGT C GAGAAG GTGTTCGGGCT GGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 ACCATGGAGGTCCGCATTAATGTCT CAAGGCAGCAGGT C GAGAAGGTGTT CGGGCT GGAG 

406 GAAT ACT GGT GC CAGT GC GT GGCAT GGAG CT C CT C GGGCACC ACCAAGAGT C AGAAGGC C 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

361 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 



105 



60 



165 



120 



225 



180 



285 



240 



345 



300 



405 



360 



465 



420 



Qy 4 66 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 421 TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 4 80 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I 
Db 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

Qy 586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I II I II I I I I I I I I I I I 
Db 541 GT GGAGT GG CT C CGGAAC GAG GAC C T GGT GG ACC C GT C C CT GGAC C CCAAT GT AT AC AT C 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 7 05 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

Qy 7 06 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 

I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

Qy 7 66 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 7 80 

Qy 82 6 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 81 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 40 

Qy 886 T GT GAGGG GC AGAAT GT C CAGAAAACAG C CT GC GC CAC CCT GT GC CCAGTAGAC G GCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 T GT GAGGGGC AGAAT GT C CAGAAAAC AGC CT G CGC CAC CCT GTG C CC AGT GGAC GGCAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

Qy 1006 GAGT GCT CT GACCCAGC AC C C CGCAAC GGAG GGGAGGAGT GCCAG GG CACT GAC CT G GAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1020 

Qy 1066 AC C C GCAACT GT AC CAGT GAC CT CT GT GT AC ACAGT G CTT C TGGCCC T GAGGAC GT GGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCTGAGGACGTGGCC 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I II I I I I I 
Db 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 12 00 

Qy 124 6 AC CT C AG G C T T C C AG C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C 1305 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1260 



Qy 1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 

I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AC CAT C C AG C C G G AC C T C AG C AC C AC C AC C AC C AC C T AC C AG G G C AGT CTCTGTCCCCGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

Qy 142 6 GGCGGCCGC C AC ACACT GC ACC AC AG CT CT C C CAC CT C T GAGG C C GAGGAGT T C GT CT C C 14 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGC G GC C G CC AC ACACT GCAC CAC AGCT CT C C CAC CT C T GAGGC C GAGGAGT T C GT CT C C 1440 

Qy 14 8 6 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1441 C GCCT CT CCAC C C AGAACT ACT T CCGCTCCCTGCCCC GAGGCAC CAGCAACAT GACCT AT 1500 

Qy 154 6 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1560 

Qy 1606 AT C C C C C C AG AT G C CAT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T CAC G C T G C AC AAG 1665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT C C C CC CAGAT GC CAT AC C C CGAG GGAAGAT CT AT GAGAT CT AC CT C AC GCT GC ACAAG 1620 

Qy 1666 C C G GAAGAC GT GAG GTT GC C CCT AGCT GGCT GT C AGAC C CT G CT GAGT CC C AT C GTT AGC 1725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

Qy 17 86 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 01 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

Qy 202 6 TCCCTC GAGTACAACAT CCGGGT CTACT GCCTGCAT GACAC CCACGATGCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I 

Db 19 81 T CC CT C GAGTACAACAT C CGG GT CTACT GCC T GC AT GACAC CCAC GAT GC ACT CAAG GAG 204 0 

Qy 2 086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

Qy 214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2101 T T C AAG GAC AGT T AC C AC AAC C T GC GC CT AT C CAT C C AC GAT GT G C C C AG CTCCCTGTGG 2160 

Qy 22 06 AAGAGT AAGCT CCTT GT CAGCTACCAGGAGAT CC CCTT TT AT CACAT CT GGAAT GGCACG 2265 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGT AAGCT C CT T GT C AG CT AC CAGGAGAT C C CCT T TT AT CACAT CT G GAAT GGCAC G 2220 

Qy 2266 C AG C G GT ACT T GC ACT GCAC CT T C AC C CT G GAGC GT GT CAG C C C CAGC AC T AGT GAC CT G 2325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

Qy 238 6 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 244 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 2341 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 
Db 24 61 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

Qy 2566 CAC CT GGAC AGC C AT CT CAGCT TCTTTGCCTC CAAGC C C AGC C C C AC AG C CAT GAT C CT C 2 625 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAC CT GGACAGC CAT CT CAGCT TCTTTGCCTC CAAGC CCAGCC C CAC AG C CAT GAT C CT C 2580 

Qy 262 6 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 264 0 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 

Db 2 641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 
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FEATURES Location/Qualifiers 
source 1. .2881 

/ organ! sm= "Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 97.3%; Score 2676.4; DB 6; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2728; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 24 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 222 T T C CT GGT GGAGC C C GAG GAT GT GT AC AT C GT C AAGAAC AAGC C AGT G CT GCT T GT GT GC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GAC C AC GT GAT C GAG C G C AG C AC AGAC G GGAGC AGT GGGCTGCC CAC CAT GGAG GT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I I I I I I I I 
Db 342 GAC CAC GT GAT C GAGC GCAGCAC AGAC GGGAGC AGT GGT GAGC C GAC CAT GGAG GT C CGC 401 

Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 42 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 402 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 461 

Qy 421 TGCGTGGCAT GGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGCCTACAT CCGCATAGCC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 62 T GC GT G GCAT GGAGCT CCT C GGG CAC CAC CAAGAGT CAGAAGGCCTACAT CC GC AT AGCC 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AAC GAGGAC C T GGT GGAC CC GT C CCT GGAC CC CAAT GT AT AC AT CAC GC GGGAGCAC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 642 AAC GAGGAC CT G GT GGAC CCGTCCCTG GAC CC CAAT GT AT AC AT CAC GC GGGAGCAC AGC 701 



Qy 



661 



CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



720 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 7 61 



721 



762 



781 



822 



841 



882 



901 



942 



958 



ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I 

ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



780 



821 



840 



881 



900 



941 



957 



GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I I I I I I I I I I I I II I I I I I I I i I I I I I i I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 

1062 C CAG CAC C C CGCAAC G GAGGGGAGGAGT GC CAG GGCACT GAC CT G GACAC C C GCAAC T GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 



1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 12 41 



1257 



1182 



1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

1258 C AGC C C GT C AGC AT C AAGC C CAGC AAAGC AGAC AAC C C C C AT CT GCT CAC CAT C CAGC C G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1302 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1362 GAC CT CAG CAC CAC CAC CAC CT AC CAGG G C AGT CTCTGTCCCC GGCAGGAT G GG C C C 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 14 37 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 147 8 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 14 97 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

147 9 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 



1498 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 



1538 



1557 



1598 



1558 TTCCTCGGGGGCCGGCT GAT GAT C C CT AAT ACAG GT AT CAGC CT C CT CAT CCCCC CAGAT 1617 

1 1 1 1 1 1 1 1 1 I I I I I I 1 1 1 1 1 I I I 1 1 I I I I 1 1 i I I I 1 1 I I I I I 1 1 1 1 1 1 I I I I I I M I II I 

1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 G C CAT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T C AC G C T G C AC AAG C C G GAAG AC GT G 1677 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

1659 GC C AT AC CCC GAGG GAAGAT C TAT GAGAT CTAC CT CAC GC T GC ACAAG C C GGAAGAC GT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 177 8 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 7 9 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I I II I I I 
1839 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGCAGGATGTG 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 197 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 T ACAAC AT CC GGGT CT ACTGC CT GCAT GACACC CAC GAT GC ACT CAAGGAGGT GGT GCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 T ACAAC AT C C GGGT CT ACT GC CT G CAT GACACC CAC GAT G CACT CAAGGAGGT G GT G CAG 2138 

2095 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CT G GAGAAGC AG CT G G G GGGAC AGCT GAT C CAGGAGC CAC GGGT CCT GCACTT CAAGGAC 2198 

2155 AGT T AC CACAAC CT GC GCCT AT C C AT CCAC GAT GT G CCC AGCT C C C T GT GGAAGAGT AAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2199 AGT T AC CACAAC C T GC GC C TAT C CAT C CAC GAT GT GC CC AGCT C CCT GTG GAAGAGTAAG 2258 

2215 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 227 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2259 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2318 

2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I II I I II I I I I I I I I I I I I I I I I I II I I 

2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
237 9 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 24 38 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 

2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I 

24 99 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 267 8 



2619 



2694 



2 635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 27 96 



2739 
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Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

. I I I I 1 1 1 1 1 I 1 1 1 1 i I I I I I I I 1 1 I I I I I 1 1 I I I 1 1 1 I I I I I I 1 1 I I I 1 1 I I I I I I I 1 1 I 

Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C C G GAC C T GCT T C CC C ACT T C CT G GT GGAG C C C GAGGAT GT GT AC AT C GT C AAG AACAAG 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAG 180 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 2 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 24 0 

Qy 283 GAGT GGGT GC GC CAGGT GGACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGT GGGCT G 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 241 GAGT GGGT GC GC CAGGT GGAC C AC GT GAT C GAGC G CAG CAC AGAC GGGAGCAGT G GGCT G 300 

Qy 343 CCCACCAT GGAGGT CCGCATT AAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT G 4 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C CCACCAT GGAGGT C CG C AT T AAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT T C GGG C T G 360 

Qy 4 03 GAGGAAT ACT GGT GCCAGT GC GT G GCAT GGAGCT CCT C GGG CACC ACCAAGAGT CAGAAG 462 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAG GAAT ACT GGTGC CAGTGC GT G GCAT GGAGCT C CT C GGGCAC CAC CAAGAGT CAGAAG 420 

Qy 463 GCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 

Qy 583 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAG GT G GAGT G GCT C C GGAAC GAG GAC CT GGT G GACC C GT C C CT GGAC C C C AAT GT AT AC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 

Qy 7 03 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 7 62 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 720 

Qy 7 63 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

I I I I I I 

Db 721 TACGTG 726 

Qy 823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 8 82 

Db 727 726 

Qy 8 83 TTCTGTGAGGGGCAGAATGTCCAGA7W^CAC^\tGCGCCACCCTGTGCCCAGTAGACGGC 942 



Db 



727 



732 



Qy 943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | I | I I I I I I I I I I I I 

Db 733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

Qy 1003 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 93 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 852 

Qy 1063 GACAC C C GC AACT GT AC C AGT G AC CT CT GT GT AC ACAGT GCTTCTGGC C CT GAG GAC GT G 1122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 853 GACACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCTGAGGACGTG 912 

Qy 1123 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 

I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 972 

Qy 1183 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 1 I I I I I I I 
Db 973 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1032 

Qy 1243 CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1302 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1033 CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1092 

Qy 1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1362 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1152 

Qy 1363 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1422 

I I I I I I I I I II I I I i I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1153 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1212 

Qy 1423 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 14 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 1213 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1272 

Qy 1483 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1273 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1332 

Qy 154 3 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 1333 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTC 1392 

Qy 1603 CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCAC 1662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1393 CT CAT CC C C CC AGAT GC CAT AC C C C GAGG GAAGAT CTAT GAGAT CTAC CT C AC GCT GCAC 1452 

Qy 1663 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1722 

I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1453 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1512 

Qy 1723 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 17 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 



Db 1513 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1572 

Qy 1783 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1573 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1632 

Qy 184 3 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 

Db 1633 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1692 

Qy 1903 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1693 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1752 

Qy 1963 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1753 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 1812 

Qy 2023 AC CT C C CT C GAGT AC AAC AT C C GG GT C TACT GC CT GCAT GAC AC C CAC GAT GCAC T CAAG 2082 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1813 AC CT C C CT C GAGT ACAACAT C C GG GT CT ACT GCCT GCAT GACAC C CAC GAT GCAC T CAAG 1872 

Qy 2083 GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 2142 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 187 3 GAGGT G GT GC AGCT GGAGAAG C AG CT GGGGGGACAGCT GAT C C AG GAGC C AC G GGT C CT G 1932 

Qy 214 3 CACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 2202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1933 CACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 1992 

Qy 22 03 T GGAAGAGT AAGCT CCTTGT CAGCT ACCAGGAGAT CCCCTTTTAT CACAT CT GGAAT GGC 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1993 T GGAAGAGT AAGCT CCTT GT CAGCT ACCAGGAGAT CCCCTTT TAT CAC AT CT GGAAT GGC 2052 

Qy 22 63 AC GC AGC GGT AC TT G CACT G C AC CT T CAC C CT G GAG C GT GT C AGC C C C AGC ACT AGT GAC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2053 ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 2112 

Qy 2323 CTGGCCT GCAAGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAAC 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2113 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2172 

Qy 2383 T T CAAC AT CAC C AAGGAC AC AAG GT T T GC T GAGCT GCT G GCT CT GGAGAGT GAAGC GG GG 2442 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2173 T T CAAC AT CAC CAAGGAC ACAAG GT T T G CT GAG CT GCTGGCT CT GGAGAGT GAAG C GG GG 2232 

Qy 2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2233 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2292 

Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2293 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2352 

Qy 2563 CT C CAC CT GGAC AGC C AT CT C AG CT T CTTTGCCTC CAAGC C C AGC C C CACAGC CAT GAT C 2622 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2353 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2412 



Qy 2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2413 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2 472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I 
Db 2473 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 

Qy 2743 GGCCGGCCAG 2752 

I I I I I I I I I I 
Db 2533 GGCCGGCCAG 2542 
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MMU487852 3992 bp mRNA linear ROD 24-SEP-2002 

Mus musculus mRNA for netrin receptor Unc5hl (Unc5hl gene) . 
AJ487852 

AJ487852. 1 GI: 22035783 

netrin receptor Unc5hl; Unc5hl gene. 

Mus musculus (house mouse) 

Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Engelkamp, D . 

Cloning of three mouse Unc5 genes and their expression patterns at 
mid-gestation 

Mech. Dev. 118 (1-2), 191-197 (2002) 

22239710 

12351186 

2 (bases 1 to 3992) 
Engelkamp, D. 
Direct Submission 

Submitted ( 15-MAY-2002 ) Neuroanatomy, Max Planck Institute for 
Brain Research, Deutschordenstrasse 46, Frankfurt 60528, GERMANY 

Location/Qualifiers 

1. .3992 

/organism= n Mus musculus" 
/mol_type="mRNA" 
/db__xref="taxon: 10090" 
1. .3992 
/gene="Unc5hl" 
232. .2928 
/gene="Unc5hl" 
/ codon_start=l 

/product= ,! netrin receptor Unc5hl" 

/protein_id="CAD32250 . 1" 

/db_xref="GI: 22035784" 

/db_xref ="GOA: Q8K1S4 " 

/ db_xref ="SPTREMBL : Q8K1S4 " 

/ trans la tion="MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYIVKNKPVLLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDGSSGLPTM 
EWINVSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLWRQARLADTAN 
YTCVAKNIVARRRSASAAVI VYVNGGWSTWTEWSVCSASCGRGWQKRSRSCTNPAPLN 



GGAFCEGQNVQKTACATLCPVDGSWSPWSKWSACGLDCTHWRSRECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTSSGPEDVALYIGLVAVAVCLILLLLVLVLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMIPNTGISLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGV 
LLTRPVILAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKEW 
QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERWASTSDLACKVWVWQVEGDGQSFNINFNITKDTRFAEMLALESEG 
GVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPSPT 
AMILNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVSEAEC" 



ORIGIN 



Query Match 84.4%; Score 2323.2; DB 10; Length 3992; 

Best Local Similarity 90.3%; Pred. No. 0; 

Matches 2484; Conservative 0; Mismatches 268; Indels 0; Gaps 0; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 187 CCGCCCGCGGGGCCCCTAGTCCAGCCCGCTCGTCCGCCCGCGGCCATGGCCGTCCGGCCC 24 6 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II II I I I I I I I I I 

Db 247 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTTCGTGGTTCGGGTGCC 306 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 18 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINI 

Db 307 CAGCAGAGTGCCACAGTGGCCAACCCAGTGCCTGGTGCCAACCCAGACCTGCTGCCCCAC 366 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 24 0 

MINIM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 367 TT C CT G GTAGAGC C GGAGGAC GT GTAC ATT GT CAAGAACAAGC C C GT GCT GCT GGT GT GC 426 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II MINIM 

Db 427 AAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAATGGGTTCGCCAGGTC 486 

Qy 301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

II I I I II I M I I I II I I M I I I I I I I I I I I II I I I I II I II II II I I I I I 

Db 4 87 GAT CAC GT CAT C GAAC GCAG CACT GAC GGCAGCAGCGGAT T GCCAAC CAT GGAGGT C CGG 546 

Qy 361 ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT ACT GGT GCCAG 420 

II II II I I M II I II I I II I I I I I I I I II II I I II I I II I I I II I II II I II II 

Db 547 ATCAACGTATCAAGGCAGCAGGTCGAGAAAGTGTTTGGGCTGGAGGAGTACTGGTGCCAG 606 

Qy 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

II I I I I I I II I I II II I II II I I I I II I I II I I II I I II I II I I I I I I II I II 
Db 607 TGTGTGGCATGGAGCTCCTCAGGAACCACCAAAAGCCAGAAGGCCTACATCCGGATTGCC 666 

Qy 4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I II I I II I I I I II II I I II II I II II II II I I II I I II II I I II III 
Db 667 TATTTGCGCAAGAACTTTGAGCAGGAGCCGCTGGCCAAGGAAGTGTCACTGGAGCAAGGC 72 6 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

N II II I II I I II II II I I I II I II II II II I I I I II I II II II II M I 

Db 727 ATTGTGCTACCTTGTCGCCCCCCGGAAGGAATCCCCCCAGCTGAGGTGGAGTGGCTCCGA 78 6 



601 AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I J I I I I I I I I II 
7 87 AATGAGGACCT CGTGGACC CCT CCCT CGACCCCAAT GT GTACATCACAC GGGAGCACAGC 84 6 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

II II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

, 84 7 CTAGTCGTGCGGCAGGCCCGCCTGGCCGACACTGCCAACTACACCTGCGTGGCCAAGAAC 906 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I II II I I I I I I I I I I I II I I 

907 ATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTATGTGAACGGTGGGTGG 966 

7 81 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
967 TCGACGTGGACCGAGTGGTCCGTCTGCAGTGCCAGCTGTGGGCGTGGCTGGCAGAAACGG 1026 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1027 AGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTCTGTGAGGGGCAGAAT 1086 

901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

1087 GTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGCTGGAGCCCATGGAGT 1146 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1147 AAGTGGTCAGCCTGCGGGCTTGACTGCACCCACTGGCGGAGCCGGGAGTGCTCCGACCCA 1206 

1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 07 GCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCTGACCTGGACACCCGCAACTGTACC 1266 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 67 AGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCTCTCTACATCGGCCTC 1326 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1327 GTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTCCTCATCTACTGCCGC 1386 

12 01 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 12 60 

I II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1387 AAGAAGGAAGGACTGGACT CAGACGT GGCT GACT CAT CCATCCTTACCT CAGGCTT CCAG 1446 

12 61 C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT CT G C T C AC CAT C C AG C C G GAC 1320 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1447 CCT GT CAGCAT CAAGC CCAGCAAAGCAGACAAT CCCCAT CTGCTCACCAT CCAACC GGAC 1506 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 
I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 

1507 CT C AG CAC C AC CAC GACCACCT ACC AGG GCAGC CT GT GT C C C C GGCAGGAT GGAC C CAGC 1566 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1567 CCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGCAGTGGCCGCCATACG 1626 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 



II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I 

1627 CTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCCCGCCTCTCCACCCAA 1686 

1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1687 AACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTATGGGACCTTCAACTTC 174 6 

1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

1747 CTCGGGGGCCGGCTGATGATCCCTAACACAGGAATCAGCCTCCTCATACCCCCGGACGCC 1806 

1621 AT AC C C C GAG G GAAGAT C TAT GAGAT CT AC CT C AC G CT GCAC AAGC C GGAAG AC GT GAGG 1680 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1807 AT CC C C C GAGGAAAGAT CTAC GAGAT CT AC CT C ACT CT GCACAAGCCAGAAGAC GT GAGG 1866 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1867 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCTATCGTTAGCTGTGGGCCCCCAGGA 1926 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II III 

1927 GTCCTGCTCACCCGGCCAGTCATCCTTGCCATGGACCACTGCGGGGAGCCCAGTCCCGAC 1986 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 
1987 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCCTGTGAGGGCAGCTGGGAGGACGTGCTGCAC 2046 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2047 CTTGGTGAGGAGTCGCCCTCTCATCTCTACTACTGCCAGCTGGAGGCCGGGGCCTGCTAT 2106 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

2107 GTCTTCACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 2166 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II 

2167 ACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACGTCCCTCGAGTACAAC 2226 

2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2227 ATCCGAGTGTACTGCCTGCACGACACCCACGATGCTCTCAAGGAGGTGGTGCAGCTGGAG 2286 

2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2287 AAGCAGCTGGGTGGACAGCTGATCCAGGAGCCCCGTGTCCTGCACTTCAAAGACAGTTAC 2346 

2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 
I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2347 CACAACCTAC GT CT GT C CAT CCAC GAC GT G C CCAGCT C CCT GT G GAAGAGCAAGCT C CT T 24 06 

2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 1 I 
2407 GT CAGCT ACCAGGAGAT C CC T TTT T AC C AC AT CT G GAAT GGC ACT CAG CAGTAT CT GC AC 2466 

2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 



Db 



24 67 TGCACCTTCACCCTGGAGCGCGTCAATGCCAGCACCAGCGACCTGGCCTGCAAGGTGTGG 2526 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2341 GT GT GG C AG GT G GAG GG C GAC GGGCAGAG CT T C AGCAT CAACT T CAACAT C AC CAAGGAC 2400 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2527 GT GTGGCAGGT GGAGGGAGAT GGACAGAGCTT CAACAT CAACTTTAACAT CACTAAGGAC 2586 

2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

II II I I I I I I I II I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2587 ACGAGGTTTGCTGAAATGCTGGCTCTGGAGAGTGAAGGGGGGGTCCCAGCCCTGGTGGGC 2646 

24 61 C C C AGT GC CT T C AAGAT CCCCTTCCT CAT T C G GC AGAAGAT AAT T T C CAGC CT GGAC C CA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 
2647 C C C AGT G C C T T C AAGAT CCCCTTCCT CAT T C G G C AAAAG AT CAT T AC C AG C C T G GAC C C A 2706 

2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Mill II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2707 CCCTGCAGCCGGGGCGCCGACTGGCGAACTCTAGCCCAGAAACTTCACCTGGACAGCCAT 2766 

2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

II I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2767 CTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTCAACCTATGGGAGGCG 2 826 

2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 
I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2827 CGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTGGCCGGACTGGGCCAG 2886 

2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2887 CCAGATGCTGGCCTCTTCACCGTGTCAGAGGCCGAGTGCTGAGACCAGCCAG 2 938 
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linear 



PAT 27-AUG-2002 



Hinck,L., Masu,M. and Masu,K.K. 



BD057524 3014 bp DNA 

Netrin receptors . 
BD057524 

BD057524.1 GI:22603130 
JP 2001505062-A/l. 
synthetic construct 
synthetic construct 
artificial sequences. 
1 (bases 1 to 3014) 
Lavigne, M. T . , Leonardo, D . E 
Netrin receptors 

Patent: JP 2001505062-A 1 17-APR-2001; 

THE REGENTS OF THE UNIV OF CALIFORNIA 

PN JP 2001505062-A/l 

PD 17-APR-2001 

PF 19-FEB-1998 JP 1998536840 

PR 19-FEB-1997 US 08/808982 

PI MARC TESSIER LAVIGNE, DAVID E LEONARDO, LINDSAY HINCK, MASAYUKI 
PI MASU, 

PI KAZUKO KEINO MASU 

PC C07Kl/00,C07K14/00,C07K17/00,C07H21/02,C07H21/04,G01N33/53 CC 

Strandedness : Double; 
CC Topology: Linear; 

FH Key Location/Qualif iers . 



FEATURES Location/Qualifiers 
source 1. .3014 



/organism="synthetic construct" 
/mol_type=" genomic DNA" 
/db xref="taxon: 32630" 



ORIGIN 



Query Match 82.1%; Score 2259; DB 6; Length 3014; 

Best Local Similarity 89.7%; Pred, No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 

Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CTGCTTCCC C ACT T C CT GGT GGAGC C C GAG GAT GT GT AC AT C GT CAAGAAC AAG C C A 225 

I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 GAC CTGCTGCCC C ACT T C CT G GT AGAGC CT GAGGAC GT GT AC AT T GT CAAGAAC AAGC C G 18 0 

Qy 22 6 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 2 85 

III II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 2 86 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 34 5 

I I I II I I I I I I I I II I I I I I II II I I II I I I I III I I II I I II I I I I 
Db 241 TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 

Qy 34 6 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 4 05 

I I I I I I I I I I I II I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 ACCATGGAGGTCCGTATCAACGTATCGAGGCAGCAGGTAGAGAAAGTGTTTGGGCTGGAG 360 

Qy 4 06 GAAT ACT GGT GCCAGT GC GTGG C AT GGAGCT C CT CGGG C AC C AC CAAGAGT CAGAAG GC C 465 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 466 TACAT CCGCATAGCCAGATTGC GCAAGAACTT C GAGCAGGAGCCGCTGGCCAAGGAGGT G 525 

I I I I I I I I II III I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I III 

Db 421 TACATCCGGATT GCCTATTTGC GCAAGAACTTT GAGCAGGAGCCACT GGCCAAGGAAGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

Qy 586 GT G GAGT G GCT C C G GAAC GAGGACCT G GT GGAC C C GT C C CT GGAC C C C AAT GT AT AC AT C 64 5 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 7 05 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 



Qy 7 06 TGCGTGGCCT^GAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I II I II I I I || I I I II I I I III II I I II II I I I I I II II 



Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 84 0 

Qy 8 86 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II III 

Db 8 41 T GT GAGGGGCAGAATGT CCAGAAAACAGCCT GC GC CACT CT GTGCCCAGTGGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I III I I I I I I I I I I I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1141 CT CAT TT ACT GT C GCAAGAAGGAAGGGCT GGACT CCGAT GT GGC CGACT CGT CCATCCT C 1200 

Qy 1246 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1305 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 12 01 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1306 AC CAT C C AGC C GGAC CT C AGC AC C AC C AC C AC C AC CT AC C AG GGCAGT CTCTGTCCCCGG 1365 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 

Db 1261 AC CAT C CAGC CAGAC CT CAGCAC CAC CACT ACC ACCT ACC AGGGCAGT CT AT GT T CGAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I Mill I II I I II I I I I I I I I I II I 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGCGGCCGC CAC AC ACT GC AC CAC AGCT CT C C CAC C T CT GAGGC C GAG GAGT T C GT CT C C 14 85 

I I II I I I I I M I I I I I I I I I II I I I I I II II I I I II I I I I II I I I II II I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 14 86 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I II I I I I I I I M I I II I II I I I II II I I I I I I I I I I II I M I I I I II I I I II II 

Db 14 41 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

M I I I II I II I I I I II I I II II I I I I I II I II I I II I I I I I I I I II M I I I I I II I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 



Qy 1606 AT CC C C C CAGAT GC CAT AC C C C GAG GGAAGAT CT AT GAGAT C T AC CT C AC GCT GCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT AC C C C C G GAT G C CAT C C C C C GAG G AAAG AT CT AC GAGAT C T AC CT CACACT GCACAAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1621 C C AGAAGACGT GAGGTT GC C CCT AG CT GG CT GT CAGAC CCT GCT GAGT C C AGT C GTT AGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I M 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I II II I I I I I I I I I I I I 

Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 T CC CT C GAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACACC C AC GAT GC ACT CAAGGAG 2085 

I I I I I I I II I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I II I I I I I I I I I 
Db 1981 T C CCTT GAGT ACAACAT C C GAGT GT ACT GC CT ACAC GACAC C C AC GAC GC T CT CAAGGAG 2040 

Qy 2086 GT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT CCT GCAC 2145 

I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 
Db 2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT CCAGGAGC CT CGCGT CCT GCAC 2100 

Qy 214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 T T C AAAG AC AGT T AC C AC AAC C T AC GT C T C T C CAT C C AC GAC GT G C C C AG CTCCCTGTGG 2160 

Qy 2206 AAGAGT AAGCT C CT T GT CAGCTACC AG GAGAT C CC CT T TT AT CAC AT CT G GAAT GGCAC G 2265 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 

Db 2221 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCATCAACGCCAGCACCAGCGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I M I I I I I I I I I I I I I I I I I I II I I I 

Db 2281 GC CT GCAAGGT GT GGGT GTGGCAGGT GGAGGGAGAT GGGCAGAGCT T C AACAT CAACTT C 2340 

Qy 238 6 AACAT C AC CAAGGACACAAGGTTT GCT GAGCT GCT G GCT CT GGAGAGT GAAGCGGGGGT C 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CACTAAG GACACAAGGT T T GCT GAAT TGTTGGCTCTG GAGAGT GAAGG GG GGGT C 2400 



Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 25 05 

1 1 1 I I I I 1 1 I 1 1 I I I 1 1 I I I I 1 1 1 1 1 I I I I I M I I i I I I I I I 1 1 1 1 1 1 1 1 I I I I I II 

Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I II I I I I I I I II I I Ml I I I I I I I I I I I II I I I I I I I II I I I I 

Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 C AC CT G GAC AGC CAT CT C AG CT T CTTTGCCTC CAAG C C CAG C C C CAC AGC CAT GAT C CT C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 CAC CT G GAC AGC C AT CT T AG C TT CTT T GCCT C CAAG C C CAGCC CT ACAGC CAT GAT C C T C 2580 

Qy 2 626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGC7^CCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2 68 6 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill II I I I 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 2746 CGGCCAG 27 52 

I II I II 

Db 2701 CAGCCAG 2707 
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ORIGIN 



linear PAT 29-OCT-2001 



AX268596 2697 bp DNA 

Sequence 15 from Patent WO0175440. 
AX268596 

AX268596.1 GI: 16541710 



Rattus sp. 
Rattus sp. 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 
1 

Cochran, S .W. , Paterson, G. Y. , Ohashi,Y.W., Morris, B.Y. and 
Pratt, J. Y. 

Schizophrenia related genes 

Patent: WO 0175440-A 15 ll-OCT-2001; 

WELFIDE CORPORATION (JP) 

Location/Qualifiers 

1. .2697 

/organism="Rattus sp." 
/mol_type="unassigned DNA" 
/db xref="taxon: 10118" 



Query Match 81.8%; Score 2252.2; DB 6; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 



0; 



Qy 

Db 



46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 
II I I II II I II I II I I I I I I II II II I I II II I I I I II II II I II II II I II Mill 
1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 



Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I II I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CT GCT T C C C C ACT T C C T GGT G GAGC C C GAG GAT GT GT AC AT C GT C AAGAAC AAG C C A 225 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I 
Db 121 GAC CT GCT GC C C CACT T C C T GGT AGAGC CT GAG GAC GT GTACAT T GT CAAGAACAAG CC G 18 0 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I II I II I I I I I II II I I I I I I I I III I I I I I I II I I I I 

Db 241 TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 

Qy 346 AC CAT G GAG GT C C GC AT T AAT GT CT CAAG G CAGC AGGT C GAGAAG GTGTTCGGGCT GGAG 405 

II I I I I I I I I I II I I I II II II I I I II I I I II I I I I I I I I I I I I I I I I I I II 

Db 301 AC CAT G GAGGT CC GT ATCAACGT AT C GAGGCAGC AGGT AGAGAAAGT GTTTGGGCT GGAG 360 

Qy 406 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 466 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I I I I II I II III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I III 
Db 421 T ACAT C CG GATT G C CT AT T T G C GCAAGAACTT T GAG CAGGAGC CACT GGC CAAGGAAGT G 4 80 

Qy 52 6 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 54 0 

Qy 58 6 GT GGAGT GGCT C C GGAAC GAGGACCT GGT GGAC C C GT CC CT G GAC C C CAAT GT AT ACAT C 645 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 541 GT G G AGT G G CT T C GAAAT GAGGAC C T C GT GGAC CCCTCCCTC GAT C C CAAT GT GTACAT C 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 

II II I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 7 80 

Qy 82 6 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 T GT GAG G GGCAGAAT GT C C AGAAAAC AGC CT G C GC C AC C CT GT GC C CAGT AGAC GG C AG C 94 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC. 900 



Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

> I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I II I I I I I I I I I I I I I I I MM II II II II II M I II I I I I II 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 108 0 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I II I I M M I I I II I I M I II II I I I II II I I I M II I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III II I I II M I I II I I I I I I I I I M I II I I I I I I I I I II I II II I I I I II I 

Db 1141 CT C ATTTACT GT C GCAAGAAGGAAGG GCT GGAC T CC GAT GT GGC CGACT C GT C CAT C CTC 1200 

Qy 1246 AC CT CAGGCT T C C AGC C C GT C AGC AT C AAGC C C AGCAAAG C AGAC AAC C C C CAT CT GCT C 1305 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I II I I I II I I M I I I I I I I II 

Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1306 AC CAT C CAGC C GG AC CT C AGCAC C AC C AC C AC C AC CT AC C AG G G C AGT CT CTGTCCCCGG 1365 

I I I I I I I M I I I I I I I I I II I I II I II I I I I I II I II I I I I I I II I I I III 1 II 

Db 1261 ACCATCCAGCCAGACCTCAGCACCACCACTACCACCTACCAGGGCAGTCTATGTTCGAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

II I I I I II II I I I I II I II I I I M I I I I I I I I I I I I I I M I II II I I I I I I I I I 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 138 0 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

I I II II I I I II I II I I I I I II I I I I I M I I M I I I I II I I II I I I I I I II I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 144 0 

Qy 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

II I I II I I I I II I I I I I I I I I I II I I I II I II II I I I I I I I I II I II I I I I I I I 

Db 1441 CGCCTCTCCACCCT^AAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I II I II I I I I II I M I I I I I I II II I I I II M I I II M M I I II II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 AT C C C C C C AG AT G C CAT AC C C C GAG G G AAG AT C T AT GAG AT C T AC C T C AC G CT G C AC AAG 1665 

II Mill I M I II I I I I I I I II I I I I II I I I I II II I I I I I II I I I I I I I I II I 

Db 1561 ATACCCCCGGATGCCATCCCCCGAGGAAAGATCTACGAGATCTACCTCACACTGCACAAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II II I I I I I M I M I I I I I I I I II I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I 

Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I II I I I I I II I I I I I I I I II I I I I I II I I I I I II II II I I II I I I I I II I II 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I Ml 

i 7 4 1 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 



Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I I I I I! I I I I I I I I I I I I I I I I 
Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 61 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I II I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAG 2085 

I I I I I I I I I I I I II I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I II I I I 
Db 1981 T CC CTT GAGT ACAACAT C CGAGT GT ACT GC CT AC ACGACAC C CAC GAC GCT C T CAAGGAG 204 0 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

Qy 214 6 T T C AAGGAC AGT T AC C AC AAC CT GC G C CT AT C CAT C CAC GAT GT G C C C AGCT C C CT GT GG 22 05 

I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 T T C AAAGACAGT T AC CAC AAC C T AC GT CT CT C CAT C CAC GAC GT G C C C AGCT C C CT GT GG 2160 

Qy 2206 AAGAGTAAGCT C CTT GT CAGCTACCAGGAGAT CCCCTTTT AT CACAT CT GGAAT GGCACG 22 65 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AAGAGCAAGCT ACTT GT C AGC TAC CAGGAGAT C C CTT T T T AC CACAT CT G GAAC G GCAC C 2220 

Qy 22 66 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGCAGT AT CT GC ACTGC AC CTT CAC C CTGGAGC GCAT CAAC GC CAG CAC CAGC GAC CT G 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I 

Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 24 00 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I II I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 



Db 



2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 



Qy 2 686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I IN 

Db 2 641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 
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RNU87305 2697 bp mRNA linear ROD 15-MAY-1997 

Rattus norvegicus transmembrane receptor UncSHl mRNA, complete cds . 
U87305 

U87305.1 GI:2055391 

Rattus norvegicus (Norway rat) 
Rattus norvegicus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 

1 (bases 1 to 2697) 

Leonardo, E. D . , Hinck,L., Masu,M., Keino-Masu, K. , Ackerman, S . L . and 
Tessier-Lavigne,M. 

Vertebrate homologues of C. elegans UNC-5 are candidate netrin 
receptors 

Nature 386 (6627), 833-838 (1997) 

97271897 

9126742 

2 (bases 1 to 2697) 

Leonardo, E. D . , Hinck,L., Masu,M., Keino-Masu, K . and 

Tessier-Lavigne,M. 

Direct Submission 

Submitted (28- JAN-1997 ) Anatomy, UCSF, 513 Parnassus, San 
Francisco, CA 94143-0452, USA 

Location/Qualifiers 

1. .2697 

/organism="Rattus norvegicus" 
/mol_type="mRNA" 
/db_xref="taxon: 10116" 

/tissue_type="brain and ventral spinal cord" 
/dev_stage="18 day embyo and 13 day embryo" 
1. .2697 
/codon_start=l 

/ product="transmembrane receptor UNC5H1" 
/protein_id="AAB57678 . 1" 
/db_xref="GI: 2055392" 

/ trans lation="MAVRPGLWPVTjLGIVljAAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYIVKNKPVLLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDSSSGLPTM 
EVRINVSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLWRQARLADTAN 
YTCVAKNIVARRRSTSAAVIVYVNGGWSTWTEWSVCSASCGRGWQKRSRSCTNPAPLN 
GGAFCEGQNVQKTACATLCPVDGSWSSWSKWSACGLDCTHWRSRECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTASCPEDVALYIGLVAVAVCLFLLLLALGLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCSRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMIPNTGISLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPWSCGPPGV 
LLTRPVI LAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKEW 



QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERINASTSDLACKVWWQVEGDGQSFNINFNITKDTRFAELLALESEG 
GVPALVGPSAFKIPFLIRQKIIASLDPPCSRGADWRTLAQKLHLDSHLSFFASKPSPT 
AMI LN LWEARH FPNGNLGQLAAAVAGLGQ P DAGL FT VS EAEC " 

ORIGIN 

Query Match 81.8%; Score 2252.2; DB 10; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CT GCT T CC C CACT T CCT GGT GGAGC C C GAGGAT GT GTACAT C GT CAAGAACAAG C CA 225 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
Db 121 GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 34 5 

IMM I I I I II I I II I II I I II II I I I I I I I I II I I I I I I I II I I I I 

Db 241 TGGGTCCGC C AG GT C GAT C AC GT AAT T GAAC G C AG C AC C GAC AG C AG C AG C G GAT T G C C A 300 

Qy 346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 4 05 

I I I I I I I I I I I I I I II II II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 ACC AT GGAGGT C C GT AT CAAC GT AT CGAG G C AG C AGGT AGAGAAAGT GTT T GGGCT GGAG 360 

Qy 406 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 4 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 42 0 

Qy 4 66 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I I I I I I I II III I I I I II I I I I I II I I I I I II I I I II I I I I I I I I I I I III 

Db 421 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 58 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db .481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGG7UVTCCCCCCAGCTGAG 540 

Qy 586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 

II I I I I I I I I I II I II I I I II I I I I I I I I III I I I I M II I I I I I II II 

Db 661 T GT GT GG C CAAGAAC AT CGT AGC C C GT C GCC GAAGC AC CT CT GCAGCG GT CAT T GTT TAT 720 



Qy 7 66 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 88 6 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GC GCCACCCT GT GCCCAGTAGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
Db 841 T GT GAGG GGCAGAAT GT C C AGAAAAC AGCCT GCGC C ACT CT GT GC C CAGT GGAT GGGAGC 900 

Qy 94 6 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC CCAGCACC C CGCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 108 0 

Qy 112 6 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 118 6 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

Ml I I I I II II I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 1141 CT CAT T T ACT GT C GCAAGAAGGAAG GGCT GGACT C C GAT GT G G CC GACT C GT C CAT C CT C 12 00 

Qy 1246 AC CT C AGG CT T C C AG C C C GT C AG CAT C AAGC C CAGC AAAGCAGACAAC C C C CAT CT GCT C 1305 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1201 AC CT C GGGCTT C C AG C CT GT CAGCAT CAAGC C CAGCAAAGC AGACAACC C C C ACCT G CT C 1260 

Qy 1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 
Db 1261 AC CAT C CAG CCAGAC CT C AGCACCAC C AC T AC C AC CT AC CAGGGCAGT CTAT GTT C GAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 148 6 CGCCTCTC C AC C C AGAACT ACT TCCGCTCCCTGCCCC GAG GC AC C AGCAACAT GAC CTAT 1545 

I I I I I I I I I I I I I I I II I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 



Qy 154 6 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 



1606 AT C C C C C CAGAT G C CAT ACC C C GAGG GAAGAT CTAT GAGAT CT AC CT CAC G CT GCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AT AC C C C C GGAT G C CAT C C C C CGAGGAAAGAT CT AC GAGAT CT AC CT CAC ACT G C AC AAG 1620 

1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 168 0 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 178 5 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I 
1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I 

1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

2026 T CCCT CGAGTACAACAT C CGGGT CTACT GCCT GCAT GACACCCACGAT GCACT CAAGGAG 2 085 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
1981 TCCCTT GAGTACAACAT C CGAGTGTACTGCCTACACGACACCCACGACGCT CTCAAGGAG 2 040 

208 6 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
2041 GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT CCAGGAGCCT CGCGT CCT GCAC 2100 

214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 

I I I I I I I I I I I I I I I I II I I I I II II I I I I I I II I I I I I II I I I I I I I I I I I I I I 
2101 T T CAAAGACAGTT AC CACAAC CTACGT CT CT CCAT C C ACGAC GT GCC CAG CT C C CT GT GG 2160 

2206 AAGAGT AAGCT C CT T GT C AGCT AC CAGGAGAT CC CCTTTT AT CAC AT CTGGAAT GGCAC G 2265 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 

2161 AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 
I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I II I I I I I I 

2221 CAGCAGTAT CT GCACT GCAC CTT C ACC CT GGAGC GCAT CAAC GC CAGCAC CAG C GAC CT G 228 0 

2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I 

2341 AACAT CACT AAGGACACAAGGTTT GCT GAATT GT T GGCT CTGGAGAGT GAAGGGGGGGT C 24 00 



2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 



Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 25 65 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 C AC C T GGAC AGC CAT CT C AGCTT CT T T G C C T C C AAGC C C AGC C C CAC AGC C AT GAT C CT C 2625 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CAC CT GGAC AGC CAT CTT AG CTTCTTTGCCTC CAAG CCCAGC C CTACAGC CAT GAT C CT C 258 0 

Qy 2 626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 
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BC058084 3844 bp mRNA linear ROD 21-OCT-2003 

Mus musculus unc-5 homolog A (C. elegans), mRNA (cDNA clone 
MGC: 66671 IMAGE : 6813463 ) , complete cds . 
BC058084 

BC058084.1 GI:34784158 
MGC. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
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Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 126 Row: b Column: 11 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 23346570. 
FEATURES Location/Qualifiers 
source 1. .3844 

/organism-"Mus musculus" 
/mol_type="mRNA" 
/strain="C57BL/6" 
/db_xref="taxon: 10090" 
/clone="MGC: 66671 IMAGE: 6813463" 

/tissue_type="Brain, mouse, 13.5, 14.5, 16.5, 17.5 dpc" 

/ cl one_l i b= " N I H_BMAP_FW 0 " 

/labJiost="DH10B" 

/note="Vector: pYX-ASC" 
gene 1. .3844 

/gene="Unc5a" 

/db_xref="LocusID: 107448" 

/db_xref="MGI: 894682" 
CDS 252. .2780 

/ codon_start=l 

/product="Unc5a protein" 

/protein_id="AAH58084. 1" 

/db_xref="GI : 34784159" 

/db_xref="LocusID: 107448" 

/ trans la tion~"MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYIVKNKPVLLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDGSSGLPTM 
EVRINVSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEV^WLRNEDLVDPSLDPNWITREHSLWRQARLADTPN 
YTCVAKNIVARRRSASAAVIVYVDGSWSPWSKWSACGLDCTHWRSRECSDPAPRNGGE 
ECRGADLDTRNCTSDLCLHTSSGPEDVALYIGLVAVAVCLILLLLVLVLIYCRKKEGL 
DSDVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKF 



misc feature 



misc feature 



misc feature 



misc feature 



QLSNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFL 
GGRLMIPNTGISLLIPPDAIPRGKI YEI YLTLHKPEDVRLPLAGCQTLLSPIVSCGPP 
GVLLTRPVI LAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAG 
ACYVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKE 
WQLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWN 
GTQQYLHCTFTLERWASTSDIACKVWVWQVEGDGQSFNINFNITKDTRFAEMLALES 
EGGVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPS 
P T AMI LN L W EARH F P N GN L GQ LAAAVAGL GQ P D AGL FT VS E AE C 1 1 
714. .926 

/note="IG; Region: Immunoglobulin" 
/db_xref="CDD: smart00409" 
984. .1130 

/note="TSPl; Region: Thrombospondin type 1 repeats" 

/db_xref="CDD:smart00209" 

1566. .1877 

/note="ZU5; Region: Domain present in ZO-1 and Unc5-like 
netrin receptors" 
/db_xref="CDD:smart00218" 
2496. .2684 

/ note=" DEATH; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis) . Alpha-helical domain 
present in a variety of proteins with apoptotic functions. 
Some (but not all) of these domains form homotypic and 
heterotypic dimers" 
/db xref="CDD:smart00005" 



ORIGIN 



Query Match 72.1%; 
Best Local Similarity 84.3%; 
Matches 2320; Conservative 



Score 1983.6; 
Pred. No. 0; 
0; Mismatches 



DB 10; Length 3844; 
264; Indels 168; Gaps 



1; 



Qy 



Db 



207 



CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 
I I I I ! II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCGCCCGCGGGGCCCCTAGTCCAGCCCGCTCGTCCGCCCGCGGCCATGGCCGTCCGGCCC 2 66 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I! I I I I I I I I I 
2 67 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTTCGTGGTTCGGGTGCC 32 6 

121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
327 CAGCAGAGTGCCACAGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTGCCCCAC 386 

181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 24 0 
I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 

387 T T C CT GGT AGAG C C G GAGGAC GT GT AC AT T GT CAAGAAC AAGCCCGT GCTGCTGGTGTGC 446 

241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

447 AAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAATGGGTTCGCCAGGTC 506 

301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

II I I I I I II II I I I I I I I I I I I I I I I I I I II Mil I I I I I I || I I M I I 

507 GAT CAC GT CAT T GAAC G CAGC ACT GAC GG CAGC AGC GGATT GCCAAC CAT GGAGGT C C GG 566 



Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 
II M I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I 



420 



Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



567 AT CAAC GTATCAAGGCAGCAGGT CGAGAAAGT GTTT GGGCT GGAGGAGT ACT GGTGC CAG 626 

421 T G C GT G G CAT G G AGCT C CT C G GGC AC C AC CAAGAGT C AGAAG GC CT AC AT C C GC AT AGC C 480 

II I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I II III 
627 T GT GT GG CATG G AGCT C CT C AGGAAC C ACCAAAAG C C AGAAGG CCT ACAT C C G GAT T GCC 68 6 

481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I III 

687 TATTTGCGCAAGAACTTTGAGCAGGAGCCGCTGGCCAAGGAAGTGTCACTGGAGCAAGGC 746 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

II I I I I I II II II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

747 ATTGTGCTACCTTGTCGCCCCCCGGAAGGAATCCCCCCAGCTGAGGTGGAGTGGCTCCGA 8 06 

601 AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 660 

II 1111111111111111 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

807 AATGAGGACCTCGTGGACCCCTCCCTCGACCCCAATGTGTACATCACACGGGAGCACAGC 8 66 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 72 0 

II II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

867 CTAGTCGTGCGGCAGGCCCGCCTGGCCGACACTCCCAACTACACCTGCGTGGCCAAGAAC 926 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II II III 

927 ATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTATGTG 974 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 



975 



974 



841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 



975 



974 



901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

II II I I I I I I I I I I I I I II I 

97 5 GATGGGAGCTGGAGCCCATGGAGT 998 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

999 AAGTGGTCAGCCTGCGGGCTTGACTGCACCCACTGGCGGAGCCGGGAGTGCTCCGACCCA 1058 

1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

II I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 

1059 GCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCTGACCTGGACACCCGCAACTGTACC 1118 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1119 AGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCTCTCTACATCGGCCTC 1178 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I II I I I I I 

1179 GTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTCCTCATCTACTGCCGC 1238 

1201 AAG AAGGAG GG GCT GGACT C AGAT GT GG CT GACT C GT C CAT T CT CAC CT CAG GC T T C CAG 12 60 

I I I I I I II II I II I I I I I I I I I I I I I I I I I I I Mill II I I I I I I I I I I I I I I I 

1239 AAGAAGGAAGGACTGGACTCAGACGT GGCT GACTCATC CAT CCTTACCTCAGGCTT CCAG 12 98 



1261 C C C GT CAGCAT CAAG C CC AGCAAAGC AGACAAC CC C CAT CT G C T C AC CAT C C AG C C GGAC 1320 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

1299 CCTGTCAGCATCAAGCCCAGCA7VAGCAGACAATCCCCATCTGCTCACCATCCAACCGGAC 1358 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1359 CT C AG C AC C AC C AC GAC CAC C T AC C AG GGC AG CCTGTGTCCC C GGC AGGAT G GAC C C AGC 1418 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II 

1419 CCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGCAGTGGCCGCCATACG 1478 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1479 CTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCCCGCCTCTCCACCCAA 1538 

1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I II II II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 AACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTATGGGACCTTCAACTTC 1598 

1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I II III 
1599 CTCGGGGGCCGGCTGATGATCCCTAACACAGGAATCAGCCTCCTCATACCCCCGGACGCC 1658 

1621 AT AC C C C GAGG GAAGAT CT AT GAGAT C T AC CT CAC G CT G C ACAAGC C GGAAGAC GT G AGG 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I 
1659 AT CCCC CGAGGAAAGAT CT AC GAGAT CTAC CT C ACT CT G C ACAAGC C AGAAGAC GT GAGG 1718 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1719 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCTATCGTTAGCTGTGGGCCCCCAGGA 177 8 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1779 GTCCTGCTCACCCGGCCAGTCATCCTTGCCATGGACCACTGCGGGGAGCCCAGTCCCGAC 1838 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I MINIMI 
1839 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCCTGTGAGGGCAGCTGGGAGGACGTGCTGCAC 18 98 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 192 0 

II M I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1899 CTTGGTGAGGAGTCGCCCTCTCATCTCTACTACTGCCAGCTGGAGGCCGGGGCCTGCTAT 1958 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 
I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I I I I I I I I I I I I I | | | I | | | | 

1959 GTCTTTACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 2018 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I 
2019 ACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACGTCCCTCGAGTACAAC 207 8 

2041 AT C C GG GT CT ACT GCCT GCAT GACAC C CACGAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 ATCCGAGTGTACTGCCTGCACGACACCCACGATGCTCTCAAGGAGGTGGTGCAGCTGGAG 2138 



Qy 

Db 



2101 
2139 



AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 

I M I I I II I I I I I I I! I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I. 

AAGCAG C T G G GT GGACAGCT GAT C CAGGAGC C C C GT GT C CT GCACT T CAAAGAC AGT T AC 



2160 
2198 



Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2199 CACAACCTACGTCTGTCCATCCACGACGTGCCCAGCTCCCTGTGGAAGAGCAAGCTCCTT 2258 

Qy 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 22 80 

II I I I I II II I I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I I III I I I I I 

Db 2259 GTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAATGGCACTCAGCAGTATCTGCAC 2318 

Qy 22 81 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2319 TGCACCTTCACCCTGGAGCGCGTCAATGCCAGCACCAGCGACCTGGCCTGCAAGGTGTGG 2378 

Qy 2 341 GT GT G GC AGGT G GAGGGC GAC GG GCAGAGCT T C AG CAT CAACT T CAAC AT C AC C AAG GAG 2400 

I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I II I I I I I I I I I II I I I I I I 

Db 2379 GT GT GGCAGGT GGAGGGAGAT GGACAGAGC T T CAACAT C AACT T TAACAT CACTAAGGAC 2438 

Qy 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I 

Db 2439 ACGAGGTTTGCTGAAATGCTGGCTCTGGAGAGTGAAGGGGGGGTCCCAGCCCTGGTGGGC 24 98 

Qy 2 461 CCCAGTGCCTTC7VAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I II I 
Db 2499 C C C AGT G C C T T C AAGAT CCCCTTCCT CAT T C G G C AAAAG AT CAT T AC C AG C C T G GAC C C A 2558 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I II I II I I I I I II I I I I I I I I I Mill I I I I I II II I I I I I I I I I I I I I II I I 

Db 2559 CCCTGCAGCCGGGGCGCCGACTGGCG7VACTCTAGCCCAGAAACTTCACCTGGACAGCCAT 2618 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 264 0 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 619 CTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTCAACCTATGGGAGGCG 267 8 

Qy 2 641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 CGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTGGCCGGACTGGGCCAG 2738 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2 739 C C AGAT GCT GGC CT CT T CAC C GT GT C AGAGG CC GAGT GCT GAGAC CAGCC AG 27 90 
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Location/Qualifiers 

1. .2688 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db xref="taxon:9606" 



CDS 



misc feature 



misc feature 



/ clone="IMAGE : 4126760" 

/tissue_type="Brain, neuroblastoma" 

/clone_lib="NIH_MGC_19" 

/lab_host="DHl0B-R" 

/note="Vector : pOTB7 " 

<1. .1627 

/ codon_start=2 

/product="Unknown (protein for IMAGE : 412 6760 ) " 
/protein_id="AAH09333 . 2 " 
/db_xref="GI: 40226528" 

/trans 1 a t i on= " DVALYVGLI AVAVCLVLLLLVLI LVYCRKKEGLDSDVADS S I LT 
SGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQLTNGHLLSPL 
GGGRHTLHHSSPTSEAEEFVSRLSTQNYFRSLPRGTSNMTYGTFNFLGGRLMIPNTGI 
SLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGVLLTRPVILA 
MDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEEAPSHLYYCQLEASACYVFTEQLGR 
FAL VGEAL S VAAAK RL KL L L FAP VAC T S L E YN I RVYC LH DT H DAL K EWQ L E KQL GGQ 
LI QE PRVLHFKDS YHNLRLS I HDVP S S LWKS KLLVS YQEI P FYH I WNGTQRYLHCT FT 
LERVSPSTSDLACKLWVWQVEGDGQSFSINFNITKDTRFAELLALESEAGVPALVGPS 
AFKIPFLIRQKIISSLDPPCRRGADWRTLAQKLHLDSHLSFFASKPSPTAMILNLWEA 
RHFPNGNLSQLAAAVAGLGQPDAGLFTVSEAEC" 
413. 

/note€="ZU5; E*egion: Domain present in ZO-1 and Unc5-like 
n e t rirfi-^et5ep t o r s " 
/db_xref="CDD: smart00218" 
1343. .1594 

/note="DEATH; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis ) " 
/db xref-"CDD:smartO0005" 



ORIGIN 



Query Match 59.4%; Score 1635.4; DB 9; 

Best Local Similarity 99.9%; Pred. No. 1.2e-264; 
Matches 1636; Conservative 0; Mismatches 1; 



Length 2688; 



Indels 



0; Gaps 



0; 



Qy 1116 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 1175 

I i I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1176 T GT C CT CATCCT CGT T TAT T GC CG GAAGAAGGAGGG GCT GGACT CAGAT GT GGCT GACT C 1235 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 120 

1236 GT C C ATT CT C AC CT C AG GCT T C CAGC C CGT C AG CAT C AAGC C C AGC AAAGC AGAC AAC C C 1295 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCC 



12 9 6 C CAT C T G CT CAC CAT C C AG CC GGAC CTC AGC ACC AC CAC CAC CAC CT AC CAG GGC AGT CT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 C CAT CT GCT CAC CAT C C AGC C G GAC C T CAGC AC CAC CAC CAC CAC CT AC CAGGGC AGT CT 



1356 



180 



1355 



240 



CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 1415 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I I 

241 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 300 



Qy 1416 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 



1475 
360 



Qy 14 76 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 1535 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I 

Db 361 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 420 

Qy 1536 CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTAT 1595 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I II I I I I I I II I I II 
Db 421 CAT GAC CT AT GGGACCT T CAACT T CCT C GG GGG C C GG CT GAT GAT C C CT AATACAGGAAT 4 80 

Qy 1596 CAGC CT C CT CAT C C C CC CAGAT GC CAT ACC C C GAGG GAAGAT CT AT GAGAT CTACCT C AC 1655 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 C AG C C T C C T CAT C C C C C CAGAT G C CAT AC C C C GAG G GAAGAT C TAT GAGAT C T AC C T C AC 540 

Qy 1656 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 1715 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 600 

Qy 1716 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 1775 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 660 

Qy 1776 CCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGA 1835 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGA 720 

Qy 1836 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 1895 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 721 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 780 

Qy 1896 CCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 1955 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 84 0 

Qy 1956 GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 2015 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 900 

Qy 2016 G G C CT GCAC C T C C CT C GAGT AC AAC AT C C GGGT CT ACT GCCT GCAT GAC AC C C AC GAT GC 2075 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 901 GGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGC 960 

Qy 2076 ACT CAAGGAGGT GGT GCAGCT G GAGAAG CAGCT GG GGG GACAGCT GAT C CAG GAG C CAC G 2135 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 ACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACG 1020 

Qy 2136 GGT CCT GCACTT CAAGGACAGTTACCACAACCT GCGCCT AT CCAT CCACGAT GT GCCCAG 2195 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 G GT C CT GC ACT T CAAGGAC AGT TAC CACAAC CT GC GCCT ATC CAT C CAC GAT GT GC CCAG 1080 

Qy 2196 CTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTG 2255 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCCCTGTG GAAGAGT AAG CT C CT T GT C AG CT AC C AGGAGAT C C C CT T T TAT CAC AT CT G 1140 

Qy 2256 GAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCAC 2315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 GAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCAC 1200 



Qy 2316 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 2375 

I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 1260 

Qy 2 376 CATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGA 2435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 CAT CAACTTCAAC AT CAC CAAGGACACAAGGTTT GCT GAGCTGCT GGCT CT GGAGAGT GA 1320 

Qy 2436 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 2495 

I I I 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 I 1 1 I I I I I I I 1 1 I I I I I I I 1 1 1 1 1 I 1 1 1 1 1 I I 1 1 1 1 1 I 1 1 1 I 

Db 1321 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 1380 

Qy 2 4 96 GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 2555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 144 0 

Qy 2556 C C AGAAACT C C AC CT GGAC AG C CAT C T C AG CT T CT T T GC CT C CAAGC C C AGC C C C AC AGC 2 615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGC 1500 

Qy 2 616 CATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGC 2675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1501 CATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGC 1560 

Qy 2676 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 2735 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 1620 

Qy 2736 GTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I ! 

Db 1621 GTGCTGAGGCCGGCCAG 1637 
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linear PAT 27-AUG-2002 



Hinck,L., Masu,M. and Masu,K.K. 



BD057525 1787 bp DNA 

Netrin receptors. 
BD057525 

BD057525. 1 GI:22603131 
JP 2001505062-A/2. 
synthetic construct 
synthetic construct 
artificial sequences. 
1 (bases 1 to 1787) 
Lavigne,M. T. , Leonardo, D. E 
Netrin receptors 

Patent: JP 2001505062-A 2 17-APR-2001; 

THE REGENTS OF THE UNIV OF CALIFORNIA 

PN JP 2001505062-A/2 

PD 17-APR-2001 

PF 19-FEB-1998 JP 1998536840 

PR 19-FEB-1997 US 08/808982 

PI MARC TESSIER LAVIGNE, DAVID E LEONARDO, LINDSAY HINCK, MASAYUKI 
PI MASU, 

PI KAZUKO KEINO MASU 

PC C07K1/0 0, C07K14/00, C07K17/00, C07H21/02, C07H21/04, G01N33/53 CC 
Strandedness : Double; 



CC Topology: Linear; 

FH Key Location/Qualifiers. 
FEATURES Location/Qualifiers 
source 1. .1787 

/ organism="synthetic construct" 
/mol_type="genomic DNA" 
/db_xref="taxon: 32630" 

ORIGIN 

Query Match 56.8%; Score 1562.4; DB 6; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 2.3e-252; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

Qy 107 0 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 112 9 

I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I | I I | | | | | | | | | | | | | | | | | | | | | 
Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 T T TATT GC C GGAAGAAGGAG GGGCT GGACT C AGAT GT G GCT GACT C GT C CAT T CTCAC CT 1249 

I I I I I I I I I 1 1 I 1 1 I 1 1 1 1 I I I I 1 1 I I I 1 1 1 I i I I 1 1 1 I 1 1 1 1 i I I I 1 1 I I I 1 1 1 1 1 I I I 

Db 12 0 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 17 9 

Qy 1250 CAGGCTTCCAGCCCGTCAGCATC-AAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 1308 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I II I I 
Db 18 0 C AG GCT T C CAGC C C GT CAG C AT CT AAGC CCAGCAAAG CAGACAAC C C CCAT C T GCT C AC C 23 9 

Qy 1309 AT C CAGC C G GAC CT CAGC AC CAC CAC C AC CAC C T AC C AGG G C AGT CT CT GT C C C C GGC AG 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 0 ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 299 

Qy 1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 142 9 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1488 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 14 8 9 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 0 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

Qy 1549 ACCTTC7\ACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 C C C C CAG AT G C CAT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T CAC G C T G C AC AAG C C G 1668 

M I II I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 0 CC C C CAGAT GC C AT AC C C C GAGG GAAGAT CT AT GAGAT CT AC CT CAC G CT GC ACAAGC C G 599 



Qy 

Db 



1669 
600 



GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 



1728 
659 



Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I |. I I I I I I I I I I I I I I I 
Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 178 9 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 77 8 

Qy 184 9 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I 
Db 77 9 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 

Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 202 9 C T C GAGT AC AACAT C C GGGT CT ACT G C CT GC AT GACAC C C AC GAT GC ACT CAAGGAG GT G 2 088 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I 
Db 958 C T C GAGT AC AACAT C C G GGT CT ACT G C CT G CAT GACAC C C AC GAT G C ACT C AAGGAGGT G 1017 

Qy 208 9 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 214 9 AAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAG 2208 

II I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGTTAC CACAACCT — GCCCTATCATCCACGATGTGCCCAGCTCCCTGTGGAAG 1134 

Qy 22 09 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 22 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1135 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 1194 

Qy 2269 C GGT AC TT GCACT GCACCTT CAC C CT GGAGC GT GT CAG C C C CAGC ACT AGT GAC CT GGC C 2328 

I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2329 T GCAAGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAAC 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

Qy 238 9 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

Qy 2449 GCCCTGGTGGGC C CCAGT G C CT T C AAGAT CCCCTTCCT CAT T C GGC AGAAGAT AAT T T C C 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 35 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 

Qy 2569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2 62 8 



Db 1495 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 1554 r 

Qy 2 629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 268 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I I I I I I I I II I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

Qy 2747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 1680 
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ORIGIN 



linear PAT 13-JAN-2001 



AX054976 9700 bp DNA 

Sequence 91 from Patent WO0073328. 
AX054976 

AX054976 . 1 GI : 12228344 



synthetic construct 
synthetic construct 
artificial sequences. 
1 

van Criekinge, W. , Roelens,!., Bogaert,T. and Verwaerde, P . 
Unc-5 constructs and screening methods 
Patent: WO 0073328-A 91 07-DEC-2000; 
Devgen NV (BE) 

Location/Qualifiers 

1. .9700 

/ organism="synthetic construct" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 32630" 
/note="plasmid pGC1037" 



Query Match 47.4%; Score 1304.2; DB 6; Length 9700; 

Best Local Similarity 99.8%; Pred. No. 4e-209; 

Matches 1306; Conservative 0; Mismatches 3; Indels 0; Gaps 



0; 



Qy 1437 CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 1496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 66 



Qy 

Db 

Qy 

Db 



1497 CCAGAACT ACT T CCGCTCCCTGC C CC GAGGCAC C AGCAACAT GAC CT AT GGGAC CTT CAA 1556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

67 C CAGAACT ACT T CCGCTCCCTGCCCC GAGG CAC C AG CAAC AT GACCT AT GGGAC CTT CAA 126 

1557 CTTCCTCGGGGGC C GGCT G AT GAT C C C T AAT AC AGGT AT C AG C CT CCT CAT C C C C C C AGA 1616 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
127 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCAGA 186 



Qy 



1617 



T GC CAT ACC C C G AG GGAAGAT CT AT GAGAT CT AC CT CAC GCTG C ACAAGC C GGAAGAC GT 167 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 187 T GC C AT AC C C C GAGGGAAGAT CT AT GAGAT CTAC CT C AC GC T GCACAAGCC GGAAGAC GT 246 

Qy 1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 247 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 306 

Qy 1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 
Db 307 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 366 

Qy 17 97 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 367 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 426 

Qy 1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 7 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 486 

Qy 1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 197 6 

I I I I I I I I I I I I I I I 1 1 I I i 1 1 1 I 1 1 1 1 I 1 1 I 1 1 1 I I I I I I I i I 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 

Db 4 87 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 546 

Qy 1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 547 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 606 

Qy 2037 C AAC AT C C GGGT CT ACT GC CT GCAT GAC ACC CACGAT GC ACT CAAG GAGGT GGT GCAGCT 2 096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 607 CAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCT 666 

Qy 2097 GGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGC CAC GGGT CCT GCACTTCAAGGACAG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 667 GGAGAAG CAGC T GGG GG GACAGCT GAT C CAG GAGC CAC GGGT C CT GC ACTT CAAGGACAG 72 6 

Qy 2157 TTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 727 TTAC CACAAC CT GC GCCT AT C CATC CAC GAT GT GC C CAGCT C CCT GTG GAAGAGT AAGC T 7 86 

Qy 2217 C CT T GT CAGCT AC CAGGAGAT C C C C T T T TAT CAC AT CT G GAAT GGC AC GC AGC G GT ACT T 227 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 787 C CTT GT CAG CTAC CAGGAGAT C C CCT TT T AT CACAT CT GGAAT GGC AC G CAGC GGT ACT T 84 6 

Qy 2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 847 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 906 

Qy 2337 GT GGGT GT GGCAGGT GGAGGGC GAC G GGCAGAGCTT CAGCAT CAACTT CAAC AT CACCAA 2396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 907 GT GGGT GT GGCAGGT GGAGGGC GAC G GGCAGAGCTT CAGCAT CAACTT CAAC AT CACCAA 966 

Qy 2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 967 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCAAGCCCTGGT 1026 

Qy 24 57 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1027 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 1086 



Qy 2517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2576 

I I M I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 1087 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 1146 

Qy 2577 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC7\ACCTGTGGGA 2636 

I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | I I I I I I I I I I I I I 

Db 1147 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 1206 

Qy 2637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1207 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 1266 

Qy 2697 C C AGC CAGAC GCTGGCCTCTT C AC AGT GT C GGAGG CT GAGT GCT GAG GC 2745 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | I | | | | | | | | 
Db 1267 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGTC 1315 
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MMU72634 9299 bp mRNA linear ROD 13-MAY-1997 

Mus musculus rostral cerebellar malformation protein (rem) mRNA, 
complete cds . 
U72634 

U72634.1 GI:2088526 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 9299) 

Ackerman, S . L. , Kozak,L.P., Przyborski , S . A. , Rund,L.A., Boyer,B.B. 
and Knowles,B.B. 

The mouse rostral cerebellar malformation gene encodes an 

UNC-5-like protein 

Nature 386 (6627), 838-842 (1997) 

97271898 

9126743 

2 (bases 1 to 9299) 

Ackerman, S. L. , Kozak,L.P., Rund, L . A. and Knowles,B.B. 
Direct Submission 

Submitted (25-SEP-1996 ) The Jackson Laboratory, 600 Main Street, 
Bar Harbor, ME 04609, USA 

Location/Qualifiers 

1. .9299 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57B6/SJL" 

/db_xref="taxon: 10090" 

/ chromosome="3" 

/map="between Amyl and Mpmv9" 

1. .9299 

/gene="rcm" 

151. .2946 

/gene="rcm" 

/function=" transmembrane receptor" 
/note="similar to C. elegans UNC-5" 



/ codon_start=l 

/product="rostral cerebellar malformation protein" 
/protein_id="AAB54103 . 1" 
/db_xref="GI: 208 8527" 

/ trans lation="MRKGLRATAARCGLGLGYLLQMLVLPALALLSASGTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHWDERVDETSGLIVREVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEDIIDPAEDRNFYI 
TIDHNLIIKQARLSDTANYTCVAKNIVAKRKSTTATVIVYVNGGWSTWTEWSVCNSRC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVTVCLA 
IT VVVALFVYRKNHRDFESDI IDSSALNGGFQPVNI KAARQDLLAVPPDLTSAAAMYR 
GPWALHDVSDKIPMTNSPILDPLPNLKIKVYNSSGAVTPQDDLAEFSSKLSPQMTQS 
LLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLIIPNSGVSLLIPAGAIPQGRVYE 
MYVTVHRKENMRPPMEDSQTLLTPWSCGPPGALLTRPVI LTLHHCADPSTEDWKIQL 
KNQAVQGQWEDWWGEENFTTPCYIQLDAEACHILTENLSTY7VLVGQSTTKAAAKRL 
KLAIFGPLCCSSLEYSIRVYCLDDTQDALKEVLQLERQMGGQLLEEPKALHFKGSIHN 
LRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHCTFTLERLSLNTVELVCKLC 
VRQVEGEGQI FQLNCTVSEEPTGI DLPLLDPASTITTVTGPSAFSI PLPI RQKLCS SL 
DAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 
EMGRH ETWS LAAEGQ Y " 



ORIGIN 



Query Match 36.0%; Score 992; DB 10; Length 9299; 

Best Local Similarity 62.7%; Pred. No. le-156; 

Matches 1660; Conservative 0; Mismatches 925; Indels 63; Gaps 5; 

Qy 149 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

III III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 308 T T C CAT CT GAC C C AC CT GAGCCATT GC CAC ACT T CCT CATT GAGC C C GAGGAAGCT T AC A 367 

Qy 2 09 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 268 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 368 T T GT GAAGAACAAGC C T GT GAAC CT GT AT T GT AAAGCCAGC C CT G C C ACCCAGAT CT ACT 427 

Qy 2 69 T CAAGTGCAACGGGGAGT GGGT GCGCCAGGT GGACCACGTGAT CGAGCGCAGCACAGACG 328 

I I I I I I I I I I I I I I I I I I I I I III I II I I I I I I III II I I I I 

Db 428 T CAAGT GCAAC AGC GAGT GGGT T CAT CAGAAGGAC CAC GT AGT AGAC GAGAGAGT AGAT G 487 

Qy 329 GGAGC AGT GGGC T GC C C ACCAT GGAGGT CC G CAT T AAT GT CT CAAGGCAGCAGGT C GAGA 38 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 488 AAAC CT CT G GT C T AAT T GT GAGAGAAGT GAGCAT T GAGAT T T C AC GCCAGCAGGT GGAG G 54 7 

Qy 38 9 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 448 

I I I I I I I I I II II I I I I I I I I I II I I I II I I I I I I II I I I I I I I I I I 
Db 548 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 607 

Qy 44 9 C CAAGAGT CAGAAGG C CTACAT CC G CAT AG C CAG AT T GC GCAAGAACTT CGAGCAG GAGC 50 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 608 CGAAGAGTCGGAAGGCATACGTGCGCATTGCGTATCTGCGGAAGACATTCGAGCAGGAAC 667 

Qy 509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 
Db 668 CCTTGGGAAAGGAAGTGTCCTTGGAGCAGGAAGTCTTACTCCAGTGTCGGCCACCTGAAG 727 

Qy 569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 62 8 

I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 



Db 728 GGATCCCAGT GGCTGAGGT GGAAT GGCTAAAGAAT GAAGACATAATT GAT C CTGCT GAAG 787 

Qy 629 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 68 8 

II M I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 788 AT C GGAACT T T TAT AT T AC TAT C GAT CACAAC CT GAT CAT CAAGCAAGC C C GACT CT C AG 84 7 

Qy 689 ACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCG 74 8 

I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 

Db 848 AT AC AGCAAAT T AT AC CT GT GTT GC CAAAAAT AT T GT T G C CAAGAGAAAAAGCAC C ACAG 907 

Qy 749 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 808 

I I I I II I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I II II I 
Db 908 CCACTGTCATCGTGTATGTTAATGGTGGCTGGTCCACCTGGACAGAGTGGTCTGTGTGTA 967 

Qy 809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I 
Db 968 ACAG CCGCTGTGGGC GAGGAT AT CAGAAAC GCACAAGAAC CT GC AC CAAC C C AGCC C CAC 1027 

Qy 8 69 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 92 8 

MM II II M I I II II II II I I I II I III II II I II Ml III I II I I 
Db 1028 T CAAT GGT GGG G C CTT CT GT GAGGGG C AGAGT GT GC AGAAAAT AG CAT GC ACT ACGT TAT 1087 

Qy 929 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 988 

I I M II II I I II II M I II I I II II II I II II II I II I II II I I 
Db 108 8 GT C C AGTGGAT G GTAGGT GGACT T CAT G GAGCAAAT G GT CAAC CT GT GGGAC T GAAT GC A 1147 

Qy 98 9 CCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCC 104 8 

M I I II I I II II I I I I I I II I II II II I II II I II I II I II 
Db 114 8 CCCACTGGCGCAGGAGGGAGTGTACAGCACCAGCCCCCAAGAACGGGGGTAAGGACTGTG 1207 

Qy 1049 AGGGCACTGACCT GGACACC CGCAACTGTACCAGT GACCTCTGTGTACACAGT GCTTCT G 1108 

I I II I I II I II I II II I I II II I I III I I I I II I 
Db 1208 ATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGCTGCTCCTG 1267 

Qy 1109 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 1165 

I I I I II I I I I I II II I I II I I I II II I I I I II I II II II 

Db 1268 ACT C AGAT GAT GT G GCT CT C T AC GT G GGGAT T GT GAT C GCT GTAACAGTCT GT CT GGC GA 1327 

Qy 1166 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 1225 

I I I I I I I I II II I I I II I I I II II II 

Db 1328 T CAC TGTTGTGGTGGCCCTGTTTGT GT AT C G GAAGAAC CAC C GT GACT T T GAGT CT GACA 1387 

Qy 122 6 TGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAG 1285 

I II II II II II I I II I I I I II M II I II II II I I 
Db 1388 T CAT T GACTC CT C AGCACT CAAT GGCGGCTTT CAGC CT GT GAAC AT CAAG G 1438 

Qy 1286 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 1345 

I I I I I I I II II I I I I I I II I II I I I I I I I I I Ml 
Db 1439 CTGCCAGACAAGATCTCCTGGCTGTCCCCCCTGACCTCACCTCAGCTGCAGCCATGTACA 14 98 

Qy 134 6 AGGGCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAA 1400 

I M I I II I I I I I I I I II II I I I I II I II I II II II 

Db 14 99 GGGGACCTGTCTATGCTCTGCATGATGTCTCAGACAAAATCCCAATGACCAACTCTCCAA 1558 

Qy 14 01 TGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCAC 1460 

I I I M I I I I II II I II I II I I 

Db 1559 TT CT GGACCCACT ACCCAACTT GAAAAT CAAAGT GT ACAACAGCT CAGGT GCT GT CACT C 1618 



Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1461 CTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1498 

III III I I I I I I I Mi I I II II I 

1619 CTCAGGATGACCTTGCCGAGTTCTCATCCAAACTGTCACCCCAGATGACCCAGTCCTTGC 1678 

1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCA 1534 

I I I I I I I I I I I I I I I 

1679 T AGAGAAT GAGG C C CT T AAC C T GAAGAAC C AGAGC CT C GCAAGAC AGACT GACCC AT C CT 1738 



1594 



1535 ACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTA 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1739 GCACAGCATTTGGTACCTTCAACTCTCTTGGGGGTCACCTCATCATTCCTAATTCAGGAG 17 98 

1595 TCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCA 1654 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II 
1799 TAAGCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGA 1858 

1655 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1859 CT GT AC ACAGGAAAGAAAAT AT GAG GC C CCC C AT GGAAGACT CT C AGAC C CT ACTT AC C C 1918 

1715 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1774 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1919 CTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGC 1978 

1775 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1834 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I 
1979 AT CACT GT GC AGAC C C CAGCAC C GAGGACT GGAAGAT CCAGCT CAAAAAC CAGGCAGT GC 2038 

1835 AGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACT 18 94 

I I I I I I I I I II I I I I II I I I I I I I I I II I I I I III 

2039 AGGGACAAT GGGAGGAT GT T GT GGT GGT T GGGGAGGAGAACT T C ACAACCC C CT GT T ACA 2098 

1895 GCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGG 1954 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

2099 TTCAGCTGGATGCAGAGGCTTGCCATATCCTCACAGAGAACCTCAGTACCTATGCCCTGG 2158 

1955 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 2014 

III I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2159 TTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCC 2218 

2015 TGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATG 2 074 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2219 T CT GCT GCT CTT CC C T GGAGT ACAGC AT T AGAGT CTACT G C CT G GAT GAC ACACAGGAT G 2278 

2075 CACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCAC 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2279 C CCT GAAGGAAGTT CTACAACT GGAGAGGCAAAT GGGAGGACAGCT CCTAGAAGAACCCA 2338 

2135 GGGT CCT G C ACTT C AAG GAC AGT TAC CACAAC CT GCGC CT AT CCAT C CAC GAT GT GC C CA 2194 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2339 AGGCTCTTCATTTTAAAGGCAGCATCCACAACCTGCGCCTGTCTATTCATGACATCGCCC 



2195 



2398 



2254 



GCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2399 AT T C C CT C T GGAAGAGCAAAT T G CT G GCT AAGT AT CAGGAAATT C CAT TTT AC CACAT CT 24 58 



Qy 

Db 



2255 GGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCA 2314 

III I I II I II I -I I I I I I I I I I | I | | || | | M | | | | | | M I III 
24 59 GGAGTGGCTCTCAAAGAAACCTCCACTGCACCTTCACTCTGGAAAGACTCAGCCTAAACA 2518 



Qy 2315 CTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCA 2374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2519 C AGT GGAACT G GTT T GCAAAC TCTGTGTGCGG CAGGT T GAAGGAGAAG GGCAGAT CT T C C 2578 

Qy 2375 GCATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTG 2434 

I M I II I I I I I I I I I II II I I I I I II 

Db 2579 AGCTCAACTGTACTGTGTCAGAGGAACCTACTGGCATCGACTTACCTCTCCTGGACCCTG 2638 

Qy 24 35 AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 2494 

Ml I I I I I I I I I I I II I I MM III II I II I 

Db 2639 CTAGTACCATCACCACTGTCACCGGACCAAGTGCTTTCAGCATTCCTCTCCCTATCCGGC 2698 

Qy 2495 AGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGG 2554 

I I I M I I II I II I II I III I Ml I I I II I M I II I I 

Db 2 699 AGAAGCTAT GCAGCAGCCT GGAT GCCCCTCAAACAAGAGGCCAT GACT GGAGGAT GCT GG 2758 

Qy 2555 CCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAG 2 614 

I M I I II I II I I I I I MM IMMI 

Db 2759 CCCATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCCCAACTG 2818 

Qy 2615 CCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGG 2674 

I I I I I I I I II M I II I I I I II I I I I I I II II I I I II I Mill 
Db 2 819 GCGTAATCCTGGATCTTTGGGAAGCACAGAACTTCCCAGATGGAAACCTGAGCATGCTGG 2878 

Qy 2 675 CTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTG 2734 

I N I I M I I I I I I I I I I I III | MM 

Db 2879 CAGCCGTCCTGGAAGAAATGGGAAGACATGAGACAGTGGTGTCCTTGGCAGCAGAAGGAC 2938 

Qy 2735 AGTGCTGA 2742 

IMMI 
Db 2939 AGTATTGA 294 6 
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AY187310 2962 bp raRNA linear VRT 06-JUN-2003 

Gallus gallus UNC5-like protein 3 mRNA, complete cds . 

AY187310 

AY187310. 1 GI: 314 42350 

Gallus gallus (chicken) 
Gallus gallus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Archosauria; Aves; Neognathae; Galli formes; Phasianidae; 
Phasianinae; Gallus. 

1 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 

Characterization of Netrin-1, Neogenin and cUNC-5H3 expression 
during chick dorsal root ganglia development 
Gene Expr. Patterns 3, 369-373 (2003) 

2 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 
Direct Submission 



JOURNAL Submitted (26-NOV-2002 ) Neurobiology & Anatomy, University of Utah, 
20 North, 1900 East, Salt Lake City, UT 84132-3401, USA 
FEATURES Location/Qualifiers 
source 1. .2962 

/organism="Gallus gallus" 
/mol_type="mRNA" 
/db_xref="taxon: 9031" 
CDS 1. .2796 

/ codon_start=l 

/product="UNC5-like protein 3" 
/protein_id="AA067275.1" 
/db_xref="GI: 31442351" 

/translation="MGKGLEGTAARCGLGMGYLLHSWLPALAVLGASRPGSAAQDDD 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPWLYCKAS PATQIYFKCNSEWVHQ 
KDHWDERVDETSGLIVCEVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEEVIDPVEDRNFYI 
TIDHNLII KQ ARL S D TAN YT C VAKN I VAK RK S T TAT VI VYVN G GW S T WT EW S ACN SRC 
GRGFQKRTRTCTNPAPLNGGAFCEGQNVQKIACTTLCPVDGKWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCEGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVIVCLA 
ISVWALFVYRKNHRDFESDIIDSSALNGGFQPWIKAARQDLLAVPPDLTSAAAMYR 
GPVYALHDVSDKIPMTNSPILDPLPNLKIKVYNTSGAVTPQDELSDFSSKLSPQITQS 
LLENETLNVKNQSLARQTDPSCTAFGTFNSLGGHLVIPNSGVSLLIPAGAVPQGRVYE 
MYWWRKEGMRPPVEDSQTLLTPWSCGPPGALLTRPWLTMHHCAEPNMDDWQIQL 
KHQAGQGPWEDWWGEENFTTPCYIQLDPEACHILTETLSTYALVGQSITKAAAKRL 
KLAI FGPLSCSSLEYSIRVYCLDDTQDALKEVLQLERQMGGQLLEEPKTLHFKGSTHN 
LRLSIHDIAHSLWKSKLPAKYQEIPFYHIWSGCQRNLHCTFTLERFSLNTLELVCKLC 
VRQVEGEGQIFQLNCSVSEEPTGIDYPIMDSAGSITTIVGPNAFSIPLPIRQKLCSSL 
DAPQTRGHDWRMLAHKLKLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 



EMGRHETWSLAAEGNY" 



ORIGIN 



Query Match 36.0%; 
Best Local Similarity 62.6%; 
Matches 1662; Conservative 



Score 991; DB 5; Length 2962; 
Pred. No. 1.7e~156; 
0; Mismatches 930; Indels 63; 



Gaps 



5; 



Qy 



Db 



149 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

I I I I M II M I I I I I I I I II I I I I I I I I I I I I I MM 

158 TTCCTTCTGATCCTCCAGAGCCATTGCCCCACTTTCTCATTGAACCCGAAGAAGCTTACA 217 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



209 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 268 

I I I I I I I M I II I I II I II I I I I I I I I I I I I I I I I I I I II I I 

218 TCGTGAAAAACAAGCCTGTGAATCTGTACTGCAAAGCGAGCCCTGCCACGCAGATCTATT 277 

269 T CAAGT GCAACGGGGAGTGGGT GCGCCAGGTGGACCACGTGAT CGAGCGCAGCACAGACG 32 8 

I I I I I I I I I I Mil III II I I I I II I I I II I I I I 

278 T TAAGT GCAACAGT GAAT GGGT T CAT CAGAAGGAT CAT GT GGT GGAT GAGAGAGT AGAT G 337 

329 GGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGA 388 

M I I I I M I I Mill I II I I III I II I I II M II 
338 AAACCTCTGGTCTGATCGTCTGTGAGGTGAGCATCGAGATTTCCCGCCAGCAGGTGGAAG 397 

389 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 448 

I I I I I I I I I M M I II I II II II M I I I I M II II II II I M I II II 
398 AGCTCTTTGGACCCGAGGACTACTGGTGCCAGTGTGTCGCCTGGAGCTCAGCTGGCACCA 457 



Qy 



449 C CAAGAGT C AGAAGGC C T ACAT C C G CAT AGC C AGAT T GC GC AAGAAC TT C GAG CAGGAGC 508 
I I I I I II I I II II I II I I | | || I I M I Mill II I I I I I || I M 



458 C C AAGAG C C GCAAGGCCTAC GT C C G CAT T G C AT AT CT CAGAAAGACT T T T GAGC AGGAG C 517 

509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i M I I I I I I I I I I I 
518 CGCTGGGGAAAGAAGTGTCCCTGGAGCAAGAGGTCCTGCTCCAGTGCCGTCCTCCTGAAG 577 

569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 62 8 

I I I I I I I I I I II I I I I I I I | I I I I I I | | | I I I I I I I I 
578 GC AT T C C AGT AG CT GAGGT AGAGT G G CT GAAGAAT GAAGAGGT GAT C GAT C CT GT GGAAG 637 

62 9 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 68 8 

M I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I 

638 AC C G AAAT T T T T AC AT C AC CAT T GAT C AC AAC C T GAT CAT C AAG C AAG CCCGGCTTTCCG 697 

689 ACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCG 74 8 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | | | | | | || 

698 ACAC G GCT AACT ACACCT GT GTT G C CAAAAACAT T GT GGC CAAAAG GAAAAG C AC GACAG 757 

74 9 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 808 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
758 CAACTGTGATTGTCTATGTGAATGGAGGCTGGTCTACCTGGACCGAGTGGTCAGCGTGCA 817 

809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
818 ACAGC C GCT GT G GGAGAGGCTTC C AGAAGC G CACAAGGAC CT G C AC T AAC C CT G C C C CAC 877 

869 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 928 

I I I I I I I I I M I I I I I I II I II I I I I I I I I I I I I I I I I I Ml I I I I I I I I I 
87 8 TCAATGGGGGGGCCTTCTGCGAGGGGCAAAATGTTCAGAAAATAGCTTGCACCACCCTGT 937 

929 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 988 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 
938 GTCCAGT GGAT GGCAAAT GGACGT CCT GGAGCAAGT GGT CCACTT GT GGCACAGAGT GTA 997 

989 C C C ACT GGC G GAG C C GT GAGT GCT CT GAC C CAGC AC C C C G C AAC GGAGGGGAG GAGT GC C 1048 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

998 CCCACTGGCGCCGGAGGGAGTGCACAGCTCCGGCCCCGAAGAATGGAGGCAAGGACTGTG 1057 

1049 AGGGCACT GACCT GGACACCC GCAACT GTACCAGT GAC CT CT GT GTACACAGT GCTT CT G 1108 

I I I I I I I I I I I I II I I I II I IN Ml 

1058 AGGGACTGGTGCTGCAGTCTAAGAACTGCACTGATGGGCTCTGCATGCAGGCTGCACCTG 1117 

1109 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 1165 

I I M M M II I I I II I I I I I I I M II III II I I I I I I I 

1118 ACTCGGATGATGTTGCTCTCTACGTGGGGATTGTCATTGCTGTGATTGTGTGCCTGGCTA 1177 

1166 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 1225 

I I I I I I I II I I I I I I I I I I I I I I I I I 

117 8 TTTCTGTGGTTGTGGCCCTGTTTGT CT AT C GCAAGAAC CAC C GT GACT TT GAGT C AGAT A 1237 

1226 TGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAG 1285 

I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II 

1238 T T AT CGACT CAT C GGC GCT AAAT GGGGGATT T C AGC CT GT TAACAT CAAG G CT G CAAGAC 1297 

12 8 6 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 1345 

MM II I I || I I I I I I I I I I I I Ml III 

1298 AAGAC CTCTTGGCAGTGCCACCAGACCTCACTTCTGCTGCAGCCATGTACA 1348 



Qy 1346 AGGGCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAA 1400 

III I I I I I I I I I I I I I I I I II I I II I I I I I I 

Db 1349 GGGGGCCTGTGTATGCCTTGCATGATGTCTCTGATAAAATCCCAATGACCAATTCTCCGA 1408 

Qy 1401 T GGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTC 1456 

I I I I I I I I I I II I I I I I Ml 

Db 14 09 T C C T G G AC C C AC T G C C C AAT C T GAAG AT T AAAG T T T AT AAC AC C T C T G GAG C AGT C AC C C 14 68 

Qy 1457 CCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 14 98 

II III I I I I I I I I I I II III I I 

Db 1469 C C CAG GAT GAACT CT CT GACT T CT C CT C C AAGCT GT C C C C AC AGAT T AC C C AGT CT CT GT 1528 

Qy 1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCA 1534 

I I I I I I II I I II MM I 

Db 152 9 T GGAGAAT GAGACT CT GAACGT GAAGAACCAAAG C CT T GC AC GG CAAACAGAC CCAT C CT 158 8 

Qy 1535 ACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTA 1594 

II I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 1589 GCACTGCATTTGGGACCTTCAACTCGTTAGGGGGCCACCTAGTAATTCCTAATTCAGGAG 164 8 

Qy 1595 T CAG C C T C C T CAT C C C C C CAG AT G C CAT AC C C C GAG G GAAG AT C TAT GAG AT C T AC C T C A 1654 

I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I II 
Db 1649 TGAGCTTGCTGATCCCAGCAGGGGCTGTTCCCCAAGGAAGAGTCTATGAAATGTATGTGA 1708 

Qy 1655 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1714 

I I I I I I I I I I I I I I I I II III I I I II I I I I I I I I I I I 

Db 1709 CAGT C CAC AG GAAGGAG GGCAT GAGAC CACCT GT AGAAGAC AGC C AGAC G CT GCT GAC AC 1768 

Qy 1715 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1774 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1769 CAGTGGTGAGCTGTGGCCCACCAGGAGCGCTGCTGACCCGACCCGTTGTGCTGACCATGC 1828 

Qy 1775 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1834 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II 

Db 1829 ACCACTGTGCTGAGCCCAACATGGATGACTGGCAGATCCAGCTCAAGCACCAGGCAGGCC 1888 

Qy 1835 AGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACT 1894 

I I I I MINIUM! || I I I I I I I I III I I I I I I 

Db 1889 AGGGAC CAT GGGAG GAT GT AGTGGTGGT C G GGGAGGAAAACTT CAC CACT CC AT GCTACA 1948 

Qy 1895 GCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGG 1954 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 194 9 T C C AGCT GGAC C C AGAGGC CT GTCAT AT C CTGAC G GAGAC C CT CAGC AC GT AC GCCTT GG 2 008 

Qy 1955 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 2014 

I I I I I I I I II I I I I II I I II I I I I I I I I II I I I I I II 

Db 2009 T G GGAC AAT C CAT CAC CAAAGCAGCAGC CAAAC GT C T CAAAT T GGC CAT CT T T GGAC CAC 2068 

Qy 2015 TGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATG 2074 

II I I II I I II II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I 

Db 2069 TGTCCTGTTCCT CAC T G GAGT ACAGC ATCCGC GT CT ACT GC CT C GAT GACAC ACAGGAT G 2128 

Qy 2075 CACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 2129 CCCTGAAGGAGGTCCTCCAGCTTGAGCGGCAGATGGGTGGGCAGCTGTTGGAGGAACCCA 2188 



Qy 2135 G GGT C CT GCAC T T CAAGGACAGTT AC CACAAC CT GCGC CT AT C CAT C C AC GAT GT GC C CA 2194 

I I M I I I I M Ml Mill II I I I I I I I I I I I II I I I I I I I 

Db 2189 AAAC T T T G CAT T T T AAG G G AAG T AC C CACAAC C T G C G C T TAT C CAT T CAT G AC AT T G C C C 2248 

Qy 2195 GCTCCCTGTG GAAGAGT AAG CT C C T T GT C AGCT AC C AGGAGAT C C C CT T T TAT CAC AT C T 2254 

I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2249 ACTCTCTCTGGAAGAGCAAACTGCCGGCTAAATACCAGGAGATTCCTTTTTACCACATCT 2308 

Qy 2255 GGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCA 2314 

■ r i ill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M i 1 1 i 

Db 2309 GGAGTGGGTGCCAGAGGAACTTGCACTGCACCTTCACGCTGGAACGATTCAGTCTCAATA 2368 

Qy 2315 CTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCA 2374 

I M M I I I I I I I M II III I I I I II II II II I I I I II I I I I I 

Db 2369 CCCTGGAGCTCGTCTGCAAACTCTGTGTGCGGCAAGTCGAAGGAGAAGGGCAGATCTTCC 2428 

Qy 2375 G CAT C AACT T C AAC AT CAC C AAG GACAC AAGGT T T G CT GAGCT GCTGGCTCT GGAGAGT G 2434 

I I I I I I I I I I I I I I III I MM | 

Db 2429 AG CT GAACT GCT CAGT AT C AGAG GAAC C C ACT GG C AT T GAT TAT C C CAT CAT G GATT C AG 2488 

Qy 2435 AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 2494 

M I I I II I I II I I M I I II I II I II I II I I II II III 
Db 24 8 9 CAGGCAGCATCACAACGATAGTTGGGCCCAACGCTTTCAGCATCCCCCTCCCAATAAGGC 2548 

Qy 24 95 AGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGG 2554 

I I I I I I II II II II I Mill I II II I II II I I I II I II I 

Db 254 9 AGAAGCT CT GC AGCAGC C T G GAT G CAC C C C AGAC C C GGGGCC AT GACT GGAG GAT GCT G G 2608 

Qy 2555 C CC AGAAACT C CAC CT GGAC AG C CAT C T C AGC TT CT T T GC CT C C AAG C C C AGC C C CAC AG 2 614 

M M I I II I II M II I I I I I I II II I I I M I II II II I I 
Db 2609 C C CACAAGCT GAAAT T GGAC AGGT AC CTAAATT AT T T T GCT AC GAAGT CGAGT C CCACT G 2 668 

Qy 2 615 CCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGC7UVCCTCAGCCAGCTGG 2674 

I M I M I II I II I I I I II I I I II II II II I II Mill 

Db 2669 GGGTGATCCTGGATCTCTGGGAAGCCCAGAATTTCCCTGATGGCAACCTGAGCATGCTGG 2728 

Qy 2675 CTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTG 2734 

I II II Ml I I II II I I II II II I I || I 

Db 272 9 CAGCAGT GCTGGAAGAAAT GGGACGACAT GAAACCGTT GTTTCTTT GGCAGCAGAAGGAA 2788 

Qy 2735 AGTGCTGAGGCCGGC 274 9 

I I I I II II I I 
Db 2789 ATT ACT GAT GC AG C C 2803 
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Location/Qualifiers 

1. .9328 

/ organism="Rattus norvegicus " 

/mol_type= M mRNA" 

/db_xref="taxon: 10116" 

/ chromosome="2 " 

1. .9328 

/gene="Unc5h3" 

151. .2946 

/gene="Unc5h3" 

/ codon_start=l 

/protein_id="BAD05181. 1" 

/db_xref="GI: 40217510" 

/translati on= "MRKGLRATAARCGLGLGYLLQMLVLPALALLS AS GTGS AAQDDD 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKAS PATQIYFKCNSEWVHQ 
KDHWDERVDETSGLI VREVS I EI S RQQVEELFGPEDYWCQCVAWS S AGTTKS RKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPMAEVEWLKNEDIIDPVEDRNFYI 
TIDHNLIIKQARLSDTANYTCV7VKNIVAKRKSTTATVIVYVNGGWSTWAEWSVCNSRC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVTVCLA 
ITVWALFVYRKNHRDFESNI I DSSALNGGFQPVNI KAARQDLLAVPPDLTSAAAMYR 
GPWALHDVSDKIPMTNSPILDPLPNLKIKVYNSSGAVTPQDDLAEFSSKLSPQMTQS 
LLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLIIPNSGVSLLIPAGAIPQGRVYE 
MYVTVHRKENMRPPMEDSQTLLTPWSCGPPGALLTRPVILTLHHCADPNTEDWKIQL 
KNQAVQGQWEDVAAA/GEENFTTPCYIQLDAEACHILTENLSTYALVGQSTTKAAAKRL 
KLAI FGPLCCSSLEYSIRVYCLDDTQDALKEVLQLERQMGGQLLEEPKALHFKGSIHN 
LRLSIHDITHSLWKSKLLAKYQEIPFYHIWSGSQRNLHCTFTLERLSLNTVELVCKLC 
VRQVEGEGQIFQLNCTVSEEPTGIDLPLLDPASTITTVTGPSAFSIPLPIRQKLCSSL 
DAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSML^VLE 
EMGRHET WS LAAEGQ Y " 
2947. .9328 
/gene="Unc5h3" 
8727. .8772 

/note="simple sequence repeats" 



polyA_signal 
ORIGIN 



/rpt_unit="gf 
9309. .9314 
/gene="Unc5h3" 



Query Match 35.8%; Score 986; DB 10; Length 9328; 

Best Local Similarity 62.7%; Pred. No. le-155; 

Matches 1651; Conservative 0; Mismatches 920; Indels 63; Gaps 



5; 



163 CCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAG 222 

II III I I I I I I I I I I I I I I I I | | | M I I I I I I I I I I I I I I I I I I 
322 C C T GAG C CAT T AC C AC AC T T T C T CAT T GAG C C C GAG G AAG C T T AC AT T GT G AAG AAC AAG 381 

223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

II Ml II I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I 

382 C CT GT GAAC CT GT AT T GTAAAGC C AG C C CT GCCAC C CAGAT CT AC T T C AAGT GCAACAGC 441 

283 GAGTGGGT GCGCCAGGT GGACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT GGGCT G 342 

I I I I I I I I Ml I I I I I I I I I IN || | | | | || MM 

442 GAAT G GGT T CAT CAGAAGGACCAC GT AGT AGAC GAGAGGGTAGAT GAAAC CT C C GGT CT C 501 

343 C C CACCAT GGAGGT CCGCAT TAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT G 402 

I I I I I I I II I I I I M I I I I II II I I II I II I || I I II 
502 ATTGTGAGAGAAGTGAGCATTGAGATTTCACGCCAGCAGGTGGAGGAACTGTTCGGGCCT 561 

403 GAGGAAT ACT G GT G C C AGT GC GT GG C AT G GAGCT C CT C GG GC AC C AC C AAGAGT C AGAAG 462 

M M I I I I M I I I II M I I II II I I I I II II I I I II II II I M II I I I II I 
562 GAAGATT ACT GGT GCCAGT GT GT GGCCT GGAGCT CAGCGGGCACT ACGAAGAGT CGGAAG 621 

4 63 GC CT AC AT C C GC AT AG C CAGAT T GC GC AAGAACT T C GAG C AG GAGC C GCT G GC C AAGGAG 522 

I I IN I Mill II II II I I I I I I I II II II I I I III I I || 

622 GC ATAC GT GC GCATT G C GT AT CT G C GGAAGACAT T T GAGCAGGAAC C CT T GG GAAAAGAA 681 

523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I M I I I II I I I I II I I I II I I II II I I II I I II | || 
682 GTGTCCTTGGAGCAGGAAGTGTTACTCCAGTGCCGGCCACCTGAAGGGATCCCAATGGCT 741 

583 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 642 

I I I I I II I I I I I I I II I II II I I I II I I I II | I II I M 
742 GAG GT GGAGT G GCTAAAGAAT GAAGAC ATAAT T GAT C CT GT C GAAGAT C GGAAT T TT T AT 801 

643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

Mill II II I I II I I I I || M I II II II II II 

802 AT C ACT AT C GAT CACAAC CT GAT CAT CAAG CAGG CAC GACT CTCAGAT ACAGC GAAT TAT 861 

703 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 762 

I I I I I I I I I I I I I I I I I I || I I II M II I 

862 AC CT GT GT T GC CAAAAACAT T GT T GC CAAGAGGAAAAGCAC CACAGC C AC C GT CAT C GT G 921 

763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

M M M I I I I I II II I II III I II I II II II II I I I II II II II 
922 TATGTTAATGGTGGCTGGTCCACCTGGGCAGAATGGTCTGTGTGTAACAGCCGCTGTGGG 981 

823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

I I I I I MMMMI I I II II I II II I M I I II II I II I I II I I 
982 C GAGGAT AT CAGAAAC GCACAAGAACCT GC AC C AAC C CAGC C C C C CT CAAT GGTGGGGCC 1041 

883 TTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 942 
I I I II II II I I II II Ml I II I I II III Ml II I I I II I II II I II III 
1042 T T CT GC GAG GGGCAGAGT GT AC AGAAAAT AGCAT GCAC CAC GT TAT G C C CAGT GGAT GGC 1101 

943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 
M I I I I I I I II I II II I II II I II II II I I II II II II I I II II II I 
1102 AGGT G GACTT CGT G GAGCAAAT GGT CAACT T GT GGGACT GAGT G CAC C C ACT GGC GGAGG 1161 

1003 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1062 



Db 1162 AGGGAGTGTACAGCACCAGCCCCCAAGAACGGGGGTAAGGACTGTGATGGCCTGGTCCTC 1221 

Qy 1063 GACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTG 1122 

I II I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I 
Db 1222 CAATCCAAGAACTGCACCGATGGGCTGTGCATGCAGGCTGCTCCTGACTCAGATGACGTT 1281 

Qy 1123 GCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTC 1179 

I I M I M I I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 12 82 GCTCTCTACGTTGGGATTGTGATCGCTGTAACCGTTTGTCTGGCAATCACTGTTGTGGTG 1341 

Qy 118 0 CTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCC 1239 

II I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

Db 1342 GCCCTGTTCGT GT AT CGCAAGAAC CAC C GT GAC T T T GAGT CT AAT AT C ATT GACT C CT CA 14 01 

Qy 124 0 AT T CT C AC CT C AGGCT T C CAG C C C GT C AGCAT C AAG C C C AGC AAAGC AGAC AAC C C C CAT 1299 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1402 GCACTCAATGGCGGCTTTCAGCCTGTGAACATCAAG GCT G C CAGACAAGAT 1452 

Qy 1300 CTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGT 1359 

I I I I I II I I I I I I I I I I I I I II I III Ml | | | | 

Db 1453 CTCCTGGCAGTACCCCCGGATCTCACCTCAGCTGCAGCCATGTACAGGGGACCCGTCTAT 1512 

Qy 1360 CCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCA 1414 

M I I I I I I II I I I I I I III I I I I I I I I 

Db 1513 GCT CT C CAT GAT GT CT CAGACAAAAT C C CAATGAC CAATT CT C CAAT T CT AGAC C C ACT G 1572 

Qy 1415 GCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTC TGAGGCC 1470 

M II I I I I I I I I I I I I I I I I M 

Db 1573 CCCAATTT GAAAAT CAAAGT GTACAACAGCTCAGGT GCTGT CACTCCT CAGGACGACCTT 1632 

Qy 1471 GAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACC 1530 

I I I I I I I III I I I I I I I I I I I II II | || 

Db 1633 GCT GAGT T CT CAT C CAAGCT GT C ACC C C AGAT GAC C CAAT C CT TGCT AGAGAAT GAG GCC 1692 

Qy 1531 AGCAACATGA CCTATGGG 1548 

Ml Ml I I III 

Db 1693 CT GAAC CT GAAGAAC CAGAGT CT CGCAAGACAGACT GAC C CAT C CT GC AC AGCGT T T GGC 1752 

Qy 1549 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 
Db 1753 ACCTTCAACTCCCTGGGCGGTCACCTCATCATCCCTAATTCAGGAGTAAGCTTGCTGATT 1812 

Qy 1609 CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCG 1668 

I I I I I I I I I I I I I I I I I I I I II II I I I I III I I I I I I 
Db 1813 CCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGACTGTACACAGGAAA 1872 

Qy 1669 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1728 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1873 GAAAAT AT GAGGCC C C CCAT GGAAGACT CT C AGAC C CT GCT GAC C CCT GT GGT GAG CT GT 1932 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1933 GGGCCTCCTGGAGCTCTGTTGACCCGTCCTGTCATCCTCACTCTGCATCACTGTGCAGAC 1992 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 184 8 

I I I I I I I I II I I || I I II I I I I I I I I I I I I I I I I I I 



Db 1993 CCTAACACCGAGGACTGGAAGATCCAGCTCAAAAACCAGGCAGTGCAGGGACAGTGGGAG 2052 

Qy 18 4 9 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I M I I I I I I I I II I I I I III I I I I I I II I I 

Db 2053 GAT GTT GT G GT T GT T G GAGAGGAAAACT T C ACAACCC C CT GTT AC AT T CAG CT GGAT GC A 2112 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2113 GAGGCTTGCCATATTCTCACGGAGAACCTCAGTACCTATGCCCTGGTTGGGCAGTCCACC 2172 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

II I I I I I I I I II I I I I I I I I I I I MM III I I II I I I II 

Db 2173 ACCAAAGCAGCTGCCAAGCGTCTGAAGCTGGCCATCTTTGGGCCCCTCTGCTGCTCTTCC 2232 

Qy 2029 CT C GAGTACAACAT C CGGGT CT ACT GC CT GC AT GACAC C C ACGATGCACT CAAGGAGGT G 208 8 

II I I I I I I MM I I I I I II I II II I II II II I II I I I I I || M | I I II 
Db 2233 CT GGAGTAT AGCAT CAGAGT CTACTGCCT GGATGACACACAGGAT GC CCTGAAGGAAGTT 2292 

Qy 2089 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 214 8 

I II II I I I I I I I II I I I M I I II I I I II II II I I I I I I 
Db 2293 C T AC AAC T G G AAAG G C AAAT G G GAG G AC AG C T C C T AGAAG AAC C C AAG G C T C T T CAT T T T 2352 

Qy 214 9 AAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAG 2208 

M I II I II I I I I I I II I II I I II I I I I II I II I I I I I I I I I I I 
Db 2353 AAAGGCAGCATCCACAACCTGCGCCTCTCAATTCATGACATCACCCATTCCCTCTGGAAG 2412 

Qy 2209 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 22 68 

M I I Mil I II I I I I I I I I I II I I I I I II II M I I II I I I II 
Db 2413 AGCAAATT GC T GGC T AAGT AT CAGGAAAT T C CAT T T T AC C ACAT CT GGAGT G GCTCT CAA 2472 

Qy 22 69 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I II I II II I I I II I I II I I I I I I I II I II I II I II I II I 

Db 2473 AGAAAC CTC C ACTGT AC C TT C ACT CT GGAAAGAC T CAGC CTAAACACAGTAGAGCT GGT T 2532 

Qy 232 9 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

M II I II I I I II I II I II I I I II II II II I II II II II II I I I 

Db 2533 TGCAAACTCTGTGTGCGGCAGGTTGAAGGAGAAGGGCAGATCTTCCAGCTCAACTGTACT 2592 

Qy 238 9 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I II II I I I Mill II II I II || 

Db 2593 GT GT CAGAG GAACCT AC T GGT AT C GAT TT G CCT CT C CT GGAC C CT GC T AGCAC C ATTAC C 2 652 

Qy 24 4 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I II I II II II II II I I I II I I II I II I I II II I I 

Db 2653 ACTGTCACTGGACCAAGTGCTTTCAGCATCCCTCTTCCTATCCGGCAGAAGCTATGTAGC 2712 

Qy 2 509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

M I II I I I I I I I I I I I I II II I II I I II II II I II II I II 

Db 2713 AGCCTGGATGCCCCCCAAACAAGAGGCCATGACTGGAGGATGCTGGCCCACAAACTTAAC 2772 

Qy 2569 CT G GAC AG C CAT CT C AGCT T CTTTGCCTC C AAGC C C AGC C C C ACAG C CAT GAT C CT CAAC 2628 

M I I I II I I II I I II II II I I I I I I I II I I I I I I I I II I I 
Db 2773 CTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCCCGACTGGCGTAATCCTGGAT 2832 

Qy 2629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2 688 

II M M I M I I I II I II II I M I I I II II I I I II II II I III 
Db 2833 CT CT GGGAAGC ACAGAACT T C C C C GAT GGAAACCT GAGCAT GCT GGC AG C CGT CCT GGAA 2892 



Qy 2 689 GGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I II II III I I I I I I I I I III 

Db 2 893 GAAAT G G GAAGACAC GAAAC CGT AGT GTC CTT G GCAGCAGAAGGT C AGT AT T GA 294 6 
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ALIGNMENTS 



RESULT 1 
ABK37922 

ID ABK37922 standard; cDNA; 2752 BP. 
XX 

AC ABK37922; 
XX 

DT 21-MAY-2002 (first entry) 
XX 

DE cDNA encoding Human protein NOV1 . 
XX 

KW Human; NOVX; ss; gene; cardiomyopathy; atherosclerosis; diabetes; 

KW cell signal processing disorder; metabolic disorder; obesity; infection; 

KW anorexia; cancer-associated cachexia; cancer; neurodegenerative disorder; 

KW Alzheimer f s disease; Parkinson's disease; immune disorder; 



KW haematopoietic disorders; dyslipidaemia; pain; asthma; hypertension; 

KW osteoporosis; Crohn's disease; multiple sclerosis; angina pectoris; 

KW myocardial infarction; ulcer; allergy; benign prostatic hypertrophy; 

KW psychosis; neurological disorder; anxiety; schizophrenia; 

KW manic depression; dementia; dyskinesia; Huntington 1 s disease; 

KW Gilles de la Tourette f s syndrome; gene therapy. 

XX 

OS Homo sapiens. 
XX 

PN WO200210216-A2. 
XX 



PD 


07 


-FEB- 


-2002. 






XX 












PF 


30 


-JUL- 


-2001; 


2001WO- 


US024225. 


XX 












PR 


28 


-JUL- 


-2000; 


2000US- 


0221409P. 


PR 


04 


-AUG- 


-2000; 


2000US- 


0222840P. 


PR 


04- 


-AUG- 


-2000; 


2000US- 


0223752P. 


PR 


04- 


-AUG- 


■2000; 


2000US- 


0223762P. 


PR 


04 


-AUG- 


-2000; 


2000US- 


0223769P. 


PR 


04- 


-AUG- 


-2000; 


2000US- 


0223770P. 


PR 


14- 


-AUG- 


•2000; 


2000US- 


0225146P. 


PR 


15- 


-AUG- 


2000; 


2000US- 


0225392P. 


PR 


15- 


-AUG- 


2000; 


2000US- 


0225470P. 


PR 


16- 


-AUG- 


•2000; 


2000US- 


0225697P. 


PR 


01- 


-FEB- 


2001; 


2001US- 


0263662P. 


PR 


05- 


-APR- 


2001; 


2001US- 


0281645P. 



XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Mezes P, Mishra V, Burgess C, Casman S, Grosse WM; 

PI Alsobrook JP f Lepley DM, Gerlach VL, Macdougall JR, Smithson G; 
XX 

DR WPI; 2002-180074/23. 

DR P-PSDB; AAU85403. 
XX 

PT New isolated cytoplasmic, nuclear, membrane bound, or secreted 

PT polypeptide, useful for treating cardiomyopathy, atherosclerosis, 

PT infections, cancer, neurodegenerative, metabolic, hematopoietic and 

PT immune disorders. 
XX 

PS Claim 9; Page 9-10; 213pp; English. 
XX 

CC The invention relates to an isolated cytoplasmic, nuclear, membrane 

CC bound, or secreted polypeptide (NOVX, x= 1-14) their variants or mature 

CC form. Also included are the nucleic acids encoding the NOVX proteins, a 

CC vector comprising the nucleic acid, a cell comprising the vector, an anti 

CC -NOVX antibody and modulators of NOVX. NOVX, the nucleic acid and the 

CC antibody are useful for treating or preventing a NOVX-associated 

CC disorder, where the disorder is selected from cardiomyopathy, 

CC atherosclerosis, diabetes, a disorder related to cell signal processing 

CC and metabolic pathway modulation, metabolic disorders, obesity, 

CC infectious disease, anorexia, cancer-associated cachexia, cancer, 

CC neurodegenerative disorders, Alzheimer f s disease, Parkinson's disease, 

CC immune disorders, haematopoietic disorders, and the various 

CC dyslipidaemias, metabolic disturbances associated with obesity, the 

CC metabolic syndrome X and wasting disorders associated with chronic 



CC diseases, bacterial, fungal, protozoal and viral infections, pain, 

CC bulimia, asthma, hypertension, urinary retention, osteoporosis, Crohn's 

CC disease, multiple sclerosis, Albright Hereditary Osteodystrophy, angina 

CC pectoris, myocardial infarction, ulcer, allergy, benign prostatic 

CC hypertrophy, and psychotic and neurological disorders, including anxiety, 

CC schizophrenia, manic depression, delirium, dementia, and dyskinesias, 

CC such as Huntington's disease and Gilles de la Tourette's syndrome. The 

CC nucleic acid is useful in gene therapy. The present sequence encodes a 

CC NOVX protein 

XX 

SQ Sequence 2752 BP; 505 A; 937 C; 829 G; 481 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2752; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


l 


CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 


60 






1 > 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I I I I | | | | | | | | | 1 1 1 1 1 




Db 


l 


CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 


60 


Qy 


61 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


120 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


120 


Qy 


121 


CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 M 1 




Db 


121 


CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 


180 


Qy 


181 


TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


TT CCT GGT GGAGC C C GAG GAT GT GTACAT C GT CAAGAACAAGC C AGT GCT GCT T GT GT GC 


240 


Qy 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 


Qy 


301 


GACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT GGGCT GCCCACCAT GGAGGT CCGC 


360 






1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


GACCACGT GAT CGAGC GCAGCACAGACGGGAGCAGTGGGCT GCCCACCAT GGAGGT CCGC 


360 


Qy 


361 


ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 


420 






1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | 




Db 


361 


ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 


420 


Qy 


421 


TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


T GCGT GG CAT GGAGCT CCT C GGG C ACCAC CAAGAGT CAGAAG G C CT ACAT C C GC AT AGC C 


480 


Qy 


481 


AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I II I 1 | | | | || 




Db 


481 


AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 


540 


Qy 


541 


ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 


600 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | I | || 




Db 


541 


ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 


600 


Qy 


601 


AAC GAGGAC C T G GT GGAC C C GT C C CT GGAC C C CAAT GTAT AC AT CACGCGGGAGC AC AGC 


660 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



601 



I I I I I I I I I I I I M I I i I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

AAC GAGGACCT G GT GGAC C CGT C C C T G GAC C C C AAT GT AT ACAT C AC GC GGGAGCACAGC 



661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | | | | | | | | || | | | 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 



841 



660 



720 



720 



780 



780 



840 



840 



AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 
I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M II I I I I I 
841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

9 01 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 102 0 

I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
9 61 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 102 0 

1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
1021 GCAC C C C G C AACGGAGG G GAGGAGT GC C AGGGC ACT GAC CT GGACACC C GCAACT GTACC 1080 

10 81 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 12 00 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 
1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 12 00 

12 01 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 01 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

1261 CCCGT CAGCATCAAGCCCAGCAAAGCAGACAACCCCCAT CT GCT CACCAT C CAGCCGGAC 1320 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1261 CCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCGGAC 1320 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I II I II I I I I I I I I 

1321 CT CAGC AC C ACC AC CAC C AC CTACCAG GG CAGT CT CT GT C C C C GGC AGGAT GGGC C C AGC 1380 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 14 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 144 0 

14 41 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 
I I I I I I I M I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 



Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACT ACT T CCGCTCCCTGCCCC GAGG C AC C AG CAAC AT GAC CT AT G GGAC CTT CAAC T T C 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 

Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTCGGGGGCCGGCT GAT GAT C C C T AAT AC AGGT AT C AGC CT C CT CAT C C C C C CAGAT GC C 162 0 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CTCGGGGGCCGGCT GAT GAT C C CTAAT AC AGGT AT C AGC C T C C T CAT C C C C C CAGAT G C C 1620 

Qy 1621 AT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T C AC G C T G C AC AAG C C G G AAGAC GT GAG G 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AT AC CC C GAGGGAAGAT CTAT GAGAT CT AC CT CACGCT GCACAAGC C GGAAGAC GT GAGG 168 0 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 174 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 

Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 17 41 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I |.| I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I II I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 01 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 198 0 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 204 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 AT C C G GGT CT ACT GC CT GC AT GAC AC C C AC GAT GC AC T C AAGGAGGT GGT G C AGCT GGAG 2100 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

Qy 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

Qy 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I 

Db 2221 GT C AGCTAC C AGGAGAT C C C CT T TT ATCAC AT CT GGAAT GGCAC G C AGC G GTACTT GC AC 2280 

Qy 22 81 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 




Qy 2341 GT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAAC.TT CAACAT CACCAAGGAC 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I I I I I I I I I I I 
Db 2341 GT GT GGCAG GT GGAGGG C GACGGGCAGAG C TT CAGCAT CAACT T CAAC ATCAC CAAGGAC 2400 

Qy 2 4 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

Qy 24 61 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 C C C AGT G C C T T C AAG AT CCCCTTCCT CAT T C G G C AGAAG AT AAT T T C C AG C C T G G AC C C A 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA.CTCCACCTGGACAGCCAT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2 640 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 
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ID ABK52891 standard; DNA; 2697 BP. 
XX 

AC ABK52891; 
XX 

DT 27-AUG-2002 (first entry) 
XX 

DE Human netrin binding membrane receptor UNC5H-1 DNA sequence #1. 
XX 

KW Netrin binding membrane receptor; receptor; UNC5H-1; gene; ds; human; 

KW nootropic; neuroprotective; cytostatic; antiparkinsonian; 

KW cerebroprotective; cancer; central nervous system; CNS; stroke; 

KW Parkinson's disease; multiple sclerosis; Alzheimer's disease. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2697 

FT /*tag= a 

FT /product= "Netrin binding membrane receptor UNC5H-1" 
XX 

PN WO200233080-A2. 
XX 

PD 25-APR-2002. 
XX 

PF 15-OCT-2001; 2001WO-EP011891 . 



PR 16-OCT-2000; 2000US-0240061P . 
XX 

PA (FARB ) BAYER AG. 
XX 

PI Koehler RH; 
XX 

DR WPI; 2002-463314/49. 

DR P-PSDB; AAU97899. 
XX 

PT Novel human netrin binding membrane receptor polypeptide and 

PT polynucleotides for identifying modulating agents useful in treating 

PT diseases e.g. Parkinson's disease, multiple sclerosis, stroke, 

PT Alzheimer's disease. 

XX 

PS Claim 1; Fig 1; 94pp; English. 
XX 

CC This invention relates to the DNA and protein sequences of a novel 

CC purified human netrin binding membrane receptor, UNC5H-1. The DNA 

CC sequence of the invention is useful as a probe for detecting a nucleic 

CC acid encoding the UNC5H-1 protein in a biological sample. The sequences 

CC of the invention are useful to screen for agents which decrease the 

CC activity of the UNC5H-1 protein. The sequences are also useful for 

CC screening agents which regulate (modulate) the activity of the protein of 

CC the invention. A pharmaceutical composition containing the protein of the 

CC invention or a reagent that modulates the activity of the UNC5H-1 protein 

CC may be useful for treating a UNC5H-1 dysfunction related disease such as 

CC cancer or a central nervous system (CNS) disorders (e.g, Parkinson's 

CC disease, multiple sclerosis, stroke and Alzheimer's disease). Fusion 

CC proteins comprising the UNC5H-1 protein are useful for generating 

CC antibodies and for in various assay systems, and the protein can be used 

CC as a bait protein in a two-hybrid assay or three-hybrid assay. The method 

CC of the invention is useful for detecting a coding sequence for the UNC5H- 

CC 1 protein. The present sequence represents a DNA sequence encoding the 

CC human netrin binding membrane receptor UNC5H-1 protein of the invention 

XX 

SQ Sequence 2697 BP; 503 A; 906 C; 807 G; 481 T; 0 U; 0 Other; 

Query Match 97.7%; Score 2687.4; DB 6; Length 2697; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2691; Conservative 0; Mismatches 6; Indels 0; Gaps 0 
Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 




Db 



1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



Qy 



106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 




Db 



61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 12 0 



Qy 



166 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 225 




Db 



121 GACCT GCT TCCCCACTTCCT GGT GGAGC CCGAGGAT GTGTACAT C GT CAAGAACAAGCCA 180 



Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 24 0 



286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 34 5 

I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TGGGTGCGC CAGGT GGACCAC GT GAT C GAGCGCAGCACAGAC GGGAGC AGT GGGCT G C C C 300 

346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 4 05 

I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

301 AC CAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGTCGAGAAGGT GT T CGGGCTGGAG 360 

4 06 G AAT AC T G GT G C C AG T G C GT G G CAT G GAG CTCCTCGGG C AC C AC C AAG AGT C AG AAG G C C 465 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

361 GAAT ACT GGT GC C AGT GC GT GGCAT GGAGC T C CT CGGGCAC C AC CAAGAGT C AGAAGGC C 42 0 

466 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 480 

526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I I I I I | | 
481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
541 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 600 

64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I 
781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 840 

886 T GTGAGGG GCAGAAT GT CCAGAAAACAGC CT G C GC C ACCCT GT GCC C AGT AGAC G GC AGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTGGACGGCAGC 900 

946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1020 

1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I M I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCCGCAACTGTACCAGTGACCTCTGTGTACACACTGCTTCTGGCCCTGAGGACGTGGCC 1080 



Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

Qy 118 6 CT C GT T T ATT GC C G GAAGAAGGAGG GGC T GGACT C AGAT GT G GCT GACT C GT CC ATT CT C 1245 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

Qy 124 6 AC CT C AG G CT T C C AGC C C GT CAG CAT CAAGC C CAG CAAAGC AGACAAC C C C CAT C T GCT C 1305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 12 01 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 12 60 

Qy 1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 13 80 

Qy 142 6 GGCGGCCGC CAC ACACT GC AC CACAGCT CT C C CAC C T CT GAG GC C GAGGAGT T C GT CT C C 1485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 4 0 

Qy 14 8 6 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1560 

Qy 1606 AT CC C C C CAGAT GC CAT AC C C C GAGGGAAGAT CT AT GAGAT C T AC CT CAC GCT GCACAAG 1665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT C C C C C CAGAT G C CAT AC C C C GAG G G AAG AT C T AT GAGAT C T AC C T CAC G C T G C AC AAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

Qy 172 6 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 17 85 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 174 0 

Qy 178 6 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 17 41 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

Qy 184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 01 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 

Db 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 



1 1 1 1 I 1 1 1 1 1 I I I I I I 1 1 I 1 1 1 1 1 1 1 i 1 1 I I I I I I 1 1 1 I I 1 1 I I I 1 1 I 1 1 I I 1 1 1 I I I I I 

Db 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

Qy 202 6 T CCCT CGAGT ACAACAT CCGGGT CTACTGCCT GC AT GACAC C CAC GAT GCACTCAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TCCCT CGAGT ACAACAT CCGGGTCTACT GCCT GCATGACACCCAC GAT GCACT CAAGGAG 204 0 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 214 5 

I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 
Db 2041 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2100 

Qy 214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 22 05 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2160 

Qy 2206 AAG AGT AAG CTCCTTGT C AG C T AC C AG GAG AT C C C C T T T TAT CAC AT C T G GAAT G G CAC G 2265 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I IMIII 

Db 2161 AAGAGTAAGCTC CTTGT CAGCTACCAGGAGAT CC CCTT TTATCACATCT GGAAT GGCAC G 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ri i i i i i i i i i i i i 

Db 22 81 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

Qy 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 24 4 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CAC CAAGGACACAAGGT T T GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 24 00 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

Qy 2566 CAC C T G G AC AG C CAT C T C AG CTTCTTTGCCTC C AAG C C C AG C C C CAC AG C CAT GAT C C T C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

Qy 2 686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 
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Qy 



1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 



Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TTC CT GGT GGAGCCCGAGGAT GT GTACAT C GT CAAGAACAAGC CAGT GCT GCTT GT GT GC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GAC CAC GT GAT C GAGCGCAGC AC AGAC GGGAG CAGT GGGCT GC C C AC CAT GGAGGT C CGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 342 GAC CAC GT GAT C GAG C G C AG CAC AG AC G G GAG CAGT GGT GAG C C GAC CAT G GAG GT C C G C 4 01 

Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 420 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATT AAT GT CT CAAG GC AGCAGGT C GAGAAGGT GT T CGGGCT GGAGGAAT AC T G GT GCCAG 4 61 

Qy 421 T G C GT G G CAT G GAG CTCCTCGGG CAC CAC C AAG AGT C AGAAG G C CT AC AT C C G CAT AG C C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 462 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 660 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 642 AAC GAGGAC CT GGT G GACCCGT C C CT GGAC C C CAAT GT AT AC AT C AC GC GGGAG CACAGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I 
Db 822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

Qy 901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 957 

I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I M 

Db 942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

Qy 1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1062 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1121 

Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

Qy 1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

Qy 1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

Qy 1258 C AG C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C AC CAT C C AG C C G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1302 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCG 1361 

Qy 1318 GAC CT CAG C AC C AC CAC C AC CAC CT AC C AGG GC AGT CTCTGTCCCC GGC AGGAT GGGC C C 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1362 GAC CT CAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 

Qy 1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

Qy 14 38 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 7 9 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

Qy 1498 C AGAAC T ACTT CCGCTCCCTGCCCC GAGGC AC C AGC AAC AT GAC C TAT GGGAC CT T C AAC 1557 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 

Db 153 9 C AGAAC T ACTT C CGCT C CCT G C C CCGAG GC AC CAGCAACAT GAC CT AT GGGACCT T CAAC 1598 

Qy 1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

Qy 1618 GCCAT ACCC CGAGGGAAGAT CT AT GAGATCT AC CT CACGCTGCACAAGCCGGAAGACGT G 1677 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1659 GCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTG 1718 

Qy 167 8 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 



Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I M I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

Qy 17 98 GAC AG CT G GAGC C T GC GC CT CAAAAAG C AGT C GT G C GAG GG CAGC T GG G AGGATGTG 1854 

I I I I I > I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1839 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGCAGGATGTG 1898 

Qy 1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

Qy 1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

Qy 1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 
Db 2 019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2 035 T AC AAC AT C C G G GT C T AC T G C C T G CAT GAC AC C C AC GAT G C AC T C AAG GAG GT G GT G C AG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 2079 T ACAACAT CCGGGTCTACT GCCTGCAT GACACC CACGATGCACT CAAGGAGGTGGT GCAG 2138 

Qy 2095 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2154 

I I I I I I I I I I I I ! I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2139 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2198 

Qy 2155 AGT T AC C AC AAC C T GC GC CT AT C CAT C C AC GAT GT GC C C AGC T C C CT GT GG AAGAGT AAG 2214 

I I M I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 2199 AGTT ACCACAAC CT G C GC C TAT C CAT C CAC GAT GT GC C CAG CTC C CT GT GGAAGAGTAAG 2258 

Qy 2215 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGT^ATGGCACGCAGCGGTAC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2259 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2318 

Qy 2275 T T G CACT G CAC CT T CAC C CT GGAG C GT GT CAGC C C C AGCAC T AGT GAC CT GG C CT GC AAG 2334 

I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | | | | | 
Db 2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | | | | | | | | 

Db 24 39 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 

Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 99 GT GGGC C C C AGT GCCT T CAAGAT C C C CT T C CT C AT T C GGC AGAAGAT AATTT C CAG CCT G 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 



Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCT^CGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 

Db 267 9 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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XX 

PT Nucleic acids encoding polypeptides with cytokine-like activities , useful 

PT in diagnosis and gene therapy. 

XX 



PS Claim 1; Page 2691-2694; 6221pp; English. 
XX 

CC The invention relates to polynucleotides (AAK51456-AAK53435) and the 

CC encoded polypeptides (AAM78323-AAM8 0302 ) that exhibit activity elating to 

CC cytokine, cell proliferation or cell differentiation or which may induce 

CC production of other cytokines in other cell populations. The 

CC polynucleotides and polypeptides are useful in gene therapy, vaccines or 

CC peptide therapy. The polypeptides have various cytokine-like activities, 

CC e.g. stem cell growth factor activity, haematopoiesis regulating 

CC activity, tissue growth factor activity, immunomodulatory activity and 

CC activin/inhibin activity and may be useful in the diagnosis and/or 

CC treatment of cancer, leukaemia, nervous system disorders, arthritis and 

CC inflammation. Note: Records for SEQ ID NO 2110 (AAK52581), 2111 

CC (AAK52582) and 3666 (AAM80020) are omitted as the relevant pages from the 

CC sequence listing were missing at the time of publication 

XX 

SQ Sequence 2907 BP; 552 A; 966 C; 881 G; 508 T; 0 U; 0 Other; 

Query Match 86.1%; Score 2368.6; DB 4; Length 2907; 

Best Local Similarity 93.0%; Pred. No. 0; 

Matches 2587; Conservative 0; Mismatches 19; Indels 177; Gaps 3; 

Qy 92 TCGCCGCTTGGCTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGC 151 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 

Db 17 0 T G G C G G G C AG AC AG C AC G GAT G GAG C G C C C AG C AG AGT G C C AC C GT G G C C AAC C C AGT G C 22 9 

Qy 152 CTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCG 211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 230 CTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCG 2 89 

Qy 212 TCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCA 271 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 290 TCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCA 349 

Qy 272 AGT G C AAC G G G G AGT GGGTGCGC C AG GT G G AC C AC GT GAT C GAG C G C AG C AC AG AC G G G A 331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 350 AGT GCAAC GGGGAGT GGGT GC GCCAGGT GGAC C AC GT GAT C GAGC G CAG CACAGAC GGGA 409 

Qy 332 GCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGG 391 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 410 GCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGG 4 69 

Qy 392 TGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCA 451 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 470 TGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCA 529 

Qy 4 52 AGAGT C AGAAG GC CT ACAT C C GCAT AGC CAG AT T GC GC AAGAACT T C GAG CAGGAGC C G C 511 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 530 AGAGTCAGAAGGCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGC 589 

Qy 512 TGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCA 571 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 590 TGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCA 649 



Qy 

Db 



572 
650 



TCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACC 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACC 



631 
709 



632 C C AAT GT AT AC AT C AC G C G G GAG C AC AG CCTGGTGGTGC G AC AG GCCCGCCTTGCT GAC A 691 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
710 C CAAT GTAT ACAT CACGC GGGAG CACAG CCTGGTGGTGC GAC AGGC C C GC CT T GCT GACA 7 69 

692 CGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTG 751 

I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
77 0 CGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTG 82 9 

752 CT GT CAT C GT C T AC 765 

I I I I I I II I I I I I I 

830 CTGTCATCGTCTACGGTGGGCCCCGGGACTCCCTGGTCACAGGGAGAGGCACTGCGGTGC 8 8 9 

7 66 GTGAACGGTGGGTGGTCGA 784 

I I I I I I I I I I I I I I II I I I 

8 90 CCCTGGGCAGTGACATGTGGCTGTCCTTCTCTGTCCGGCCAGTGAACGGTGGGTGGTCGA 94 9 

7 85 CGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCC 84 4 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

950 CGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCC 1009 

845 GGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCC 904 
I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I 
1010 GGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCC 1069 

905 AGAAAACAG C C T GC GC C AC CCTGTGCC C AGT AG AC GGC AGCT G GAG C C C GT GGAGC AAGT 964 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
107 0 AGAAAACAG C CT GC GCCAC C CT GT G CC C AGT GGAC G GCAGCT GGAG CC C GT GGAGCAAGT 1129 

965 GGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCAC 1024 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1130 GGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCAC 1189 

1025 C C C G CAAC GGAG G GGAGGAGT GC C AGGGC ACT GAC C T GGAC AC C C G CAACT GT AC C AGT G 10 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1190 C C CGCAAC GGAGGGGAGGAGT GCCAGGGC ACT GAC CT GGACAC C C G CAACT GT AC C AGT G 1249 

1085 AC CT CTGT GT ACACA 1099 

I II I I I I I I I I I II I 

125 0 ACCTCTGTGTACACAACTCCTACACCCCTGCCCCCACCAAGGCCATGCTGTCTCCCGCAG 1309 

1100 GTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCC 1159 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1310 CTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCC 1369 

1160 TGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACT 1219 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1370 TGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACT 1429 

1220 C AGAT GT G GCT G ACT C GT C CAT T CT C AC CT CAGGCT T C C AGC C C GT C AGC AT C AAGC C C A 12 79 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1430 CAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 14 89 

12 80 G C AAAG C AGAC AAC C C C CAT CT GCT C AC CAT C CAG C C GGAC C T C AGC AC C AC C AC CAC C A 1339 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
14 90 GCAAAGCAGACAAC C CC C AT CT GCT CAC CAT C CAG C CGGAC CT CAGCAC CAC CAC CAC CA 1549 



Qy 134 0 CCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1550 CCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCA 1609 

Qy 1400 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCA 1459 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1610 ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCA 1669 

Qy 1460 CCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGC 1519 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I 

Db 167 0 CCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGC 1729 

Qy 1520 C C C GAG G CAC CAG CAACAT GAC CT AT GGGAC CTT CAACT T CCT C GGG GGCC G G CT GAT GA 157 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1730 CCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGA 1789 

Qy 1580 T C CCTAAT ACAGGT ATCAGC CT CCT CAT CCC C C CAGATGCCATAC C CCGAGGGAAGAT CT 1639 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 17 90 T C C CT AAT ACAGGAAT CAGC CT C CT CAT CCC C CCAGAT GC CAT AC CC C GAGGGAAGAT CT 1849 

Qy 164 0 AT GAG AT CT AC C T C AC GCT G C AC AAG C C G GAAGAC GT GAGGT T GC C C CT AG CTGGCTGTC 1699 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1850 ATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTG 1887 

Qy 1700 AGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAG 1759 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 88 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAG 1924 

Qy 1760 TCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCA 1819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1925 TCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCA 1984 

Qy 182 0 AAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCT 1879 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1985 AAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCT 2044 

Qy 1880 CCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGG 1939 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2045 CCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGG 2104 

Qy 1940 GCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGC 1999 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2105 GCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGC 2164 

Qy 2000 TTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGC 2059 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2165 TTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGC 2224 

Qy 2060 AT GACAC CCACGAT GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGC 2119 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2225 AT GACAC CCACGAT GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCTGGGGGGACAGC 2284 

Qy 212 0 TGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCA 2179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2285 T GAT CC AGGAGC C AC G GGT C CT G C ACTT CAAG GAC AGTT AC CACAAC CT GC G C CT AT C CA 2344 

Qy 2180 TCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCC 2239 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2 345 T C C AC GAT GT GC C C AGCT C C C T GT GGAAGAGT AAG CT C CTT GT C AGCTAC CAGGAGAT C C 2404 

Qy 2240 C CT T T TAT CACAT CT G GAAT GGC AC GCAGC GGT ACT T G C AC T GCAC CT T C AC C C T GGAG C 2299 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 

Db 24 05 CCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGC 24 64 

Qy 2 300 GTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCG 2359 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 65 GTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCG 2524 

Qy 2360 ACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGC 2419 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2525 ACGGGCAGAGCTT CAGCAT CAACTTCAACAT CACCAAGGACACAAGGTTTGCT GAGCTGC 2584 

Qy 242 0 TGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCC 2479 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2585 TGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCC 2 644 

Qy 24 80 CCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCG 2539 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2645 CCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCG 2704 

Qy 254 0 ACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCA 2 599 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 

Db 27 05 ACTGGCGGACTCTGGCCCAG7VAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCA 2764 

Qy 2600 AGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCA 2659 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2765 AGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCA 2824 

Qy 2 660 ACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCA 2719 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2 825 ACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCA 2 884 

Qy 2720 C AGT GT C GGAGGCT GAGT GCT GA 2742 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 8 85 CAGT GT CGGAGGCT GAGT GCT GA 2907 



RESULT 5 
ABK15169 

ID ABK15169 standard; DNA; 3580 BP. 
XX 

AC ABK15169; 
XX 

DT 23-APR-2002 (first entry) 
XX 

DE Human REPTR 1 cDNA sequence. 
XX 

KW REPTR; human; antiinflammatory; cytostatic; immunosuppressive; antiviral; 

KW anti-HIV; antiarthritic; anticonvulsant; nootropic; neuroprotective; 

KW antiallergic; antibody; immunogen; endometriosis; 

KW gastrointestinal disorder; gastritis; oesophageal carcinoma; 

KW Crohn's disease; irritable bowel syndrome; ulcerative colitis; 

KW endocrine disorder; hypothalamus disorder; Kallman's disease; 

KW autoimmune disease; inflammatory disease; infertility; receptor; 



KW acquired immune deficiency syndrome; AIDS; rheumatoid arthritis; allergy; 

KW osteoarthritis; diabetes mellitus; multiple sclerosis; 

KW systemic lupus erythematosus; cell proliferative disorder; cancer; 

KW developmental disorder; Duchenne muscular dystrophy; gene; 

KW Becker muscular dystrophy; neurological disorder; epilepsy; 

KW Alzheimer's disease; Huntington's disease; reproductive disorder; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 4. .2532 

FT /*tag= a 

FT /product= "REPTRl protein" 
XX 

PN WO200198354-A2. 
XX 

PD 27-DEC-2001. 
XX 

PF 21-JUN-2001; 2001WO-US019942 . 
XX 

PR 21-JUN-2000; 2000US-0214027P . 

PR 25-AUG-2000; 2000US-0228045P . 

PR 12-DEC-2000; 2000US-0255104P . 
XX 

PA (INCY-) INCYTE GENOMICS INC. 
XX 

PI Griffin JA, Kallick DA, Tribouley CM, Yue H, Nguyen DB, Tang YT; 

PI Lai P, Policky JL, Azimzai Y, Lu DAM, Graul R, Yao MG, Burford N; 

PI Hafalia AJA, Baughn MR, Bandman 0, Patterson C, Yang J, Xu Y; 

PI Gandhi AR, Warren BA, Ding L, Sanjanwala MS, Duggan BM, Lu Y; 
XX 

DR WPI; 2002-090432/12. 

DR P-PSDB; AAU17818. 
XX 

PT Twelve human receptors (referred to as REPTR-1 to REPTR-12), useful in 

PT the diagnosis, treatment and prevention of gastrointestinal (e.g. 

PT gastritis), autoimmune/inflammatory (e.g. osteoarthritis) and cell 

PT proliferative (e.g. cancer ) disorders . 
XX 

PS Claim 57; Page 142-143; 157pp; English. 
XX 

CC This invention relates to twelve human receptors cDNA sequences referred 

CC to as REPTR-1 to REPTR-12), and the proteins encoded thereby. The 

CC proteins of the invention may have antiinflammatory, cytostatic, 

CC immunosuppressive, antiviral, anti-HIV, antiarthritic, muscular active 

CC general, anticonvulsant, nootropic, neuroprotective, antiallergic 

CC activities. The sequences of the invention may be used to produce REPTR 

CC agonists or antagonists, and the protein sequences may be used to raise 

CC anti-REPTR antibodies. These molecules and the REPTR polynucleotides and 

CC polypeptides of the invention are useful in the diagnosis , treatment and 

CC prevention of gastrointestinal (e.g. gastritis, oesophageal carcinoma, 

CC Crohn's di sease, irritable bowel syndrome, ulcerative colitis), endocrine 

CC (e.g. hypothalamus disorder, Kallman's disease), autoimmune/ inflammatory 

CC (e.g. acquired immune deficiency syndrome (AIDS), rheumatoid arthritis, 

CC allergies, osteoarthritis, diabetes mellitus, multiple sclerosis, 

CC systemic lupus erythematosus), cell proliferative (e.g. cancer), 

CC developmental (e.g. Duchenne and Becker muscular dystrophy), neurological 



CC (e.g. epilepsy, Alzheimer • s disease, Huntington f s disease) and 

CC reproductive (e.g. infertility, endometriosis) disorders. Numerous other 

CC examples of each disorder are given in the specification. The present 

CC sequence represents the human REPTR1 cDNA sequence of the invention 

XX 

SQ Sequence 3580 BP; 670 A; 1233 C; 1025 G; 652 T; 0 U; 0 Other; 



Query Match 85.6%; Score 2356; DB 6; Length 3580; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2537; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C C G GAC CT GCT T C C C CACT T C CT GGT GGAG C C C GAGGAT GT GT AC AT C GT CAAGAACAAG 222 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 121 CCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAG 18 0 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 240 

Qy 283 GAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTG 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAGT GGGT GCG C CAG GT G GAC CAC GT GAT CGAGC GCAG C ACAGAC G GGAGC AGT GGGCT G 300 

Qy 34 3 CCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTG 4 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | I 

Db 301 C C CAC CAT GGAG GT C CGC ATTAAT GT CT CAAGGCAGCAG GT C GAGAAGGT GT T C GGGCT G 360 

Qy 403 GAGGAAT ACT GGT GC CAGT GC GT GGCAT GGAGCT C CT C GGGC ACC AC CAAGAGT C AGAAG 462 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAG 42 0 

Qy 463 GCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I 
Db 421 GCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 54 0 

Qy 583 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 7 62 

I I I I I I I I I I I M I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | I | | 



Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 720 

Qy 763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

I I I I I I 

Db 721 TACGTG 72 6 

Qy 823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

Db 727 726 

Qy 8 83 T T C T GT GAG GG GC AGAAT GT C C AGAAAACAGC C T GC G C C AC CCTGTGCC C AGT AGAC G GC 942 

I I I I I I 

Db 727 GACGGC 732 

Qy 943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

Qy 1003 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1062 

I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 793 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 852 

Qy 1063 GACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTG 1122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 853 GACAC CCGCAACT GTACCAGTGACCT CTGT GTACACACT GCTT CTGGCCCTGAGGACGT G 912 

Qy 1123 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 972 

Qy 1183 AT C CT C GT T TAT T GC C GGAAGAAGGAGGGGCTG GACT CAGAT GT GGCT GACT C GTC C AT T 1242 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 973 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1032 

Qy 1243 CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1302 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1033 CT CAC CT CAGGCT TC CAGC C C GT CAGCAT CAAGC C CAGCAAAGC AGACAACC C C CAT CT G 1092 

Qy 1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1152 

Qy 1363 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1153 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1212 

Qy 1423 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1482 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1213 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1272 

Qy 1483 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1273 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCT^VCATGACC 1332 

Qy 1543 TAT GG GAC CTT CAACT T C CT C GGGGG C C G G CTGAT GAT C C CT AAT ACAGGT AT CAGC CT C 1602 

I I I I I I I II I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1333 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTC 1392 



1603 CT CAT C CC C C C AGAT GCC AT AC C CC GAG G GAAGAT CT AT GAGAT C T AC CT CAC GC T GCAC 1662 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 

1393 CT CAT CCCCCCAGAT GCCATACCCCGAGGGAAGAT CTAT GAGAT CTACCTCACGCT GCAC 1452 

Qy 1663 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1453 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1512 

Qy 1723 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1782 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I 

Db 1513 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1572 

Qy 178 3 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1573 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1632 

Qy 1843 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1633 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1692 

Qy 1903 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1693 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1752 

Qy 1963 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1753 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 1812 

Qy 2023 ACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAG 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1813 AC CT C C CTC GAGTACAACAT CC GGGT CT ACT GC CT G CAT GAC ACC CAC GAT GC ACT CAAG 1872 

Qy 2083 GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1873 GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 1932 

Qy 2143 CACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 2202 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I 

Db 1933 CACTT CAAGGACAGTTAC CACAACCT GC GCCT AT C CAT C CAC GAT GT GC C CAGCT C CCT G 1992 

Qy 2203 TGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGC 22 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1993 T GGAAGAGTAAGCTCCTT GTCAGCTACCAGGAGATCCCCTTTTAT CACAT CT GGAAT GGC 2052 

Qy 2263 ACGCAGC GGT ACTT GCACTGCACCT T CAC C CT GGAGCGT GT CAGCCC CAGCACT AGT GAC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 053 ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 2112 

Qy 2323 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2113 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2172 

Qy 2383 TTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 24 42 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2173 T T CAACAT CAC CAAGGACACAAGGT T T G CT GAGCT GCT GGCT CT G GAGAGT GAAG C GGGG 2232 



Qy 

Db 



Qy 

Db 



2443 
2233 



GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 



2502 
2292 



Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 93 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2352 

Qy 2563 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2622 

I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2353 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2412 

Qy 2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2 682 

I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2413 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 24 72 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2473 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 

Qy 27 43 GGCCGGCCAG 2752 

I I I I I I I I I I 
Db 2533 GGCCGGCCAG 2542 



AAV52940; 

25-MAR-2003 (revised) 
21-DEC-1998 (first entry) 

Rat UNC-5 homologue unc5h-l cDNA. 

UNC-5; UNC5H-1; rat; netrin receptor; cell migration; axon guidance; 
diagnosis; therapy; ds . 



RESULT 6 
AAV52940 

ID AAV52940 standard; cDNA; 3014 BP. 
XX 
AC 
XX 
DT 
DT 
XX 
DE 
XX 
KW 
KW 
XX 
OS 
XX 
FH 
FT 
FT 
XX 
PN 
XX 
PD 
XX 
PF 
XX 
PR 
XX 
PA 
XX 
PI 
XX 



Rattus sp. 

Key 
CDS 



WO9837085-A1 
27-AUG-1998. 
19-FEB-1998; 
19-FEB-1997; 



Location/ Qualifiers 
1. .2697 
/*tag= a 



98WO-US003143. 
97US-00808982. 
(REGC ) UNIV CALIFORNIA. 

Tessier-Lavigne M, Leonardo ED, Hinck L, Masu M, Keinomasu K; 



DR WPI; 1998-495364/42. 

DR P-PSDB; AAW78898. 
XX 

PT Netrin-binding, vertebrate proteins - useful for diagnosis, therapy and 

PT the biopharmaceutical industry. 

XX 

PS Claim 7; Page 15-17; 32pp; English. 
XX 

CC This cDNA, termed unc5h-l, comprises a rat homologue of Caenorhabditis 

CC elegans unc-5. Rat unc5h-l and unc5h-2 (see AAV52942) cDNAs were isolated 

CC from an E18 brain cDNA library. The predicted proteins (see AAW78898 and 

CC AAW78900) show similarity with UNC-5. They are predicted to be involved 

CC in cell migration and axon guidance, and are characterised as receptor 

CC proteins for netrins . Gene expression is observed in regions where 

CC differentiating neurons are undergoing axogogenesis . Human unc5h-l (see 

CC AAV52941) and unc5h-2 (see AAV52943) cDNAs are also claimed. Vertebrate 

CC UNC-5 proteins may be produced recombinantly from transfected host cells 

CC by utilising these vertebrate UNC-5 nucleic acids. The invention also 

CC provides unc-5 hybridisation probes and primers, vertebrate UNC-5- 

CC specific binding agents such as specific antibodies, and methods of 

CC making and using the subject compositions in diagnosis (e.g. genetic 

CC hybridisation screens for vertebrate unc-5 transcripts), therapy (e.g. 

CC gene therapy to modulate vertebrate unc-5 gene expression) and in the 

CC biopharmaceutical industry (e.g. as immunogens, reagents for modulating 

CC cell guidance, reagents for screening chemical libraries for lead 

CC pharmacological agents, etc.). (Updated on 25-MAR-2003 to correct PI 

CC field.) 
XX 

SQ Sequence 3014 BP; 596 A; 977 C; 849 G; 592 T; 0 U; 0 Other; 



Query Match 82.1%; Score 2259; DB 2; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 



Qy 


46 


ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 


105 






1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 


60 


Qy 


106 


CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 


165 






II M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 


120 


Qy 


166 


GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 


225 






1 1 1 1 1 M 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 


180 


Qy 


226 


GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 


285 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 




Db 


181 


GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 


240 


Qy 


286 


TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 


345 






1 1 1 1 1 1 1 1 1 1 1 1 1 II Mill II II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 




Db 


241 


TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 


300 


Qy 


346 


AC CAT GGAG GT C C G CAT T AAT GT C T CAAGGC AGC AGGT C GAGAAGGT GT T C G GG CT GGAG 


405 






1 1 1 1 II 1 1 1 1 1 1 1 1 II II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


AC CAT GGAG GT CC GT AT CAAC GT AT CGAGGC AGC AG GT AGAGAAAGT GT T T GG GCT GGAG 


360 



Qy 


406 


Db 


361 


Qy 


466 


Db 


421 


Qy 


526 


Db 


481 


Qy 


586 


Db 


541 


Qy 


646 


Db 


601 


Qy 


706 


Db 


661 


Qy 


766 


Db 


721 


Qy 


826 


Db 


781 


Qy 


886 


Db 


841 


Qy 


946 


Db 


901 


Qy 


1006 


Db 


961 


Qy 


1066 


Db 


1021 


Qy 


1126 


Db 


1081 


Qy 


1186 


Db 


1141 



GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 4 65 
I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I II I I I II I II I I I I I II 
GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 
I I I I I I I I M IN I I I I II I I I I | | | | I I I II I I I I I I I I | | | | I I I I I III 
TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 
M I I I I I I I I I I I I I II II II II II II II II II I I I I | Mill III 
TCACTGGAGCTVAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 
I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 



I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 



TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 
II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I || M 
TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 85 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II! 
GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 94 5 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || M III 
TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 900 

TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I hi I I 

TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

GAGT GCT CT GACC C AGCAC CC C GCAAC G GAG GGGAG GAGT G C CAGGGCACTGACCT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III I I I I I I I I I 11 

GAGT GCT CT GAC C CAGC AC CC C GCAAT GGAGGT GAGGAGTGT C G GGGT GCT GAC CT G GAC 1020 

ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 
I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I 
ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 
I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 
I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I III 
CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 



Qy 1246 AC CT CAG G C TT C CAGC CC GT CAGCAT CAAG C CC AGC AAAG C AGACAAC C C C C AT CT GCT C 1305 

I I I I I i I I I I I l< I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I 
Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1306 AC CAT C CAG C C G G AC C T CAG C AC C AC C AC C AC C AC C T AC CAG G G C AGT CTCTGTCCCCGG 1365 

I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I II 
Db 12 61 AC CAT CCAGCCAGACCTCAGCACCACCACTACCACCTACCAGGGCAGT CTAT GTT C GAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I M I I I I I II II I I I I I II II I I I I I Mill I I I I I I I I I I I I I I I I I II 
Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 14 8 6 CGCCTCTC C AC C C AGAACT ACT T CCGCTCCCTGCCCC GAGG C AC C AGCAAC AT GAC CTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I | | M I I 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 154 6 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I i I I I I I 1 1 1 1 1 I I I M I I I I I I I I I I II Ml Ill 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 AT C C C C C CAG AT G C CAT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T C AC G C T G C AC AAG 1665 

M I II II II II II II II II I II I II II II II II I II II II I II II II I II II II 
Db 1561 ATACC CCCGGAT GCCAT CCCCCGAGGAAAGAT CTACGAGAT CTACCTCACACTGCACAAG 162 0 

Qy 1666 CC GGAAGAC GT GAGGT T GCC C CT AGCT GGCT GT C AGAC C CT G CT GAGT C C CAT C GT TAG C 1725 

M I I I II II II II II II II II II I II I II II II II II II II II I II II I II I 

Db 1621 C CAGAAGAC GT GAGGT T GCC C CTAGCT GGCT GT C AGAC C CT GCT GAGT C CAGT C GT T AGC 168 0 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

M M II II II II II II II II II II II II II I I II II I II II II II II I 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

M M II II I II II II II II II I I I II I II I I I II II II II II I II II II II II I II I 
Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I M I I M M M II II I II I I II II I II I II I M II II I I II I II I I II II II I I 
Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I II I I II II II I II II II I I II I I II II I II II II II II II II M I II I II I II I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 192 0 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I II I I II II II II I I II II II I II I I III I II I || || I || M I II I I I II II 
Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 198 0 

Qy 2026 T C C C T C GAGT ACAAC AT C C G G GT CT ACT GC CT G CAT GAC AC C C AC GAT GC ACT CAAG GAG 2085 

I I II I II I II II II M I II II II I I II I I II II II II II II I II II II I II II 
Db 1981 T C C CT T GAGT ACAACAT C C GAGT GT ACT G CCT ACAC GACAC C CAC GAC GC T CT CAAG GAG 204 0 

Qy 2 086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 



Db 


2041 


Qy 


2146 


Db 


2101 


Qy 


2206 


Db 


2161 


Qy 


2266 


Db 


2221 


Qy 


2326 


Db 


2281 


Qy 


2386 


Db 


2341 


Qy 


2446 


Db 


2401 


Qy 


2506 


Db 


2461 


Qy 


2566 


Db 


2521 


Qy 


2626 


Db 


2581 


Qy 


2686 


Db 


2641 


Qy 


2746 


Db 


2701 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 

GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 
I I I I I I I II I I I I I I I I I I I I I II || I I I I I I I | | | | I I I I M I I I I I II I I I I I 
TTC7WVGACAGTTACCACAACCTACGTCTCTCCATCCACGACGTGCCCAGCTCCCTGTGG 2160 

AAGAGTAAG CT C CT T GT C AGC T AC C AGGAGAT C C C C T T T TAT C AC AT C T G GAAT GG CAC G 2265 

I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I IN I I I I I 

AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

C AGC G GT ACT T G CAC T G CAC C T T CAC C CT GGAG C GT GT C AGC C C C AGC ACT AGT GAC CT G 2325 
I I M III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I || I | | | | | 
CAGCAGT AT CTGCACT GCACCTT CAC C CT GGAGC GCAT CAACGCCAGCACCAGCGACCT G 2280 

GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I M I I 

GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 244 5 

I HI I I I I I I I I I I I I I II I I I I I I | 

AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 24 00 

C C AGC CCTGGTGGGCCC C AGT GC CT T CAAGAT C C C CT T C CT C AT T C GGC AGAAGAT AAT T 2505 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 
CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I | I I I I 
GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I IN 
AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 264 0 

GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I I I I I I Mill I I I I I I I I I M II I I I I I I I I I II I I I I I I I I II I 
GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 



I I I 



RESULT 7 
AAS16843 

ID AAS16843 standard; cDNA; 2697 BP. 
XX 

AC AAS16843; 
XX 

DT 14-FEB-2002 (first entry) 
XX 

DE Rat netrin receptor UNC5H1 (YSG7) cDNA. 



XX 

KW YSG; YSG7; schizophrenia; chronic animal .model; LCGU; netrin receptor; 

KW local cerebral glucose utilisation; phosphodiesterase 1-alpha; UNC5H1; 

KW calcium-independent alpha-latrotoxin receptor; CIRL; trkE; synapsin 1A; 

KW epithelial discoidin domain receptor 1; synapsin IB; neuroleptic; ss; 

KW tumour necrosis factor alpha; TNF-alpha; rat. 
XX 

OS Rattus sp. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2697 

FT /*tag= a 

FT /product^ "Rat netrin receptor UNC5H1 " 

XX 

PN WO200175440-A2. 
XX 

PD ll-OCT-2001. 
XX 

PF 02-APR-2001; 2001WO-GB001486. 
XX 

PR 31-MAR-2000; 2000GB-00007880 . 

PR 26-MAY-2000; 2000GB-00012768 . 
XX 

PA (WELF- ) WELFIDE CORP. 
XX 

PI Cochran S, Paterson G, Ohashi Y, Morris B, Pratt J; 

XX 

DR WPI; 2002-010813/01. 

DR P-PSDB; AAU10543. 
XX 

PT Novel chronic animal model of schizophrenia, useful for identifying anti- 

PT psychotic drugs and genes that are associated with schizophrenia. 

XX 

PS Claim 1; Fig 8a; 79pp; English. 
XX 

CC The invention relates to YSG polynucleotide fragments for use in 

CC diagnosing and/or developing treatments for schizophrenia using chronic 

CC animal models. The polynucleotides and their encoded polypeptides are 

CC used for identification of compounds which modulate the expression of YSG 

CC molecules, leading to the manufacture of schizophrenia medicaments. The 

CC sequences can also be used for testing candidate compounds for any effect 

CC on the polypeptides. Anti-schizophrenic effects of a compound can be 

CC determined by measuring local cerebral glucose utilisation (LCGU) or 

CC comparing its expression level with that of a control group. The 

CC sequences are useful in the identification of genes associated with 

CC schizophrenic states and in the development of an antibody. The sequences 

CC of the invention include phosphodiesterase 1-alpha, calcium-independent 

CC alpha-latrotoxin receptors (CIRL) -1, 2&3, epithelial discoidin domain 

CC receptor 1 (trkE), netrin receptor (UNC5H1) , synapsins 1A and AB and 

CC tumour necrosis factor (TNF) alpha. This sequence represents rat netrin 

CC receptor UNC5H1 ( YSG7 ) DNA 

XX 

SQ Sequence 2697 BP; 541 A; 864 C; 766 G; 526 T; 0 U; 0 Other; 



Query Match 81.8%; Score 2252.2; DB 6; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 



0; 



Qy 


46 


Db 


1 


Qy 


106 


Db 


61 


Qy 


166 


Db 


121 


Qy 


226 


Db 


181 


Qy 


286 


Db 


241 


Qy 


346 


Db 


301 


Qy 


406 


Db 


361 


Qy 


466 


Db 


421 


Qy 


526 


Db 


481 


Qy 


586 


Db 


541 


Qy 


646 


Db 


601 


Qy 


706 


Db 


661 


Qy 


766 


Db 


721 


Qy 


826 


Db 


781 



ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

MINIM II Mill! I I I I I I I I I I I I I II 

ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 
M M I I I I II I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I | | | I I I I M I I I I I 
CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

GAC CT GCT T C C C C ACT T C CT GGT GGAGC C C GAG GAT GT GT ACAT C GT C AAGAAC AAGC CA 225 

MMI I I | | | MM! II I I II M I I I I M II I M I M 

GACCTGCTGC CCCACTT CCT GGTAGAGCCT GAGGACGT GTACATTGT CAAGAACAAGCCG 180 
GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III I I I I M Ml I II I I MMI I II II I II I I M I I I II I II I I M I II II I 

GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 
TGGGTGCGC C AGGT GGAC CAC GT GAT C GAG C G CAGCAC AGACG GGAG C AGT GGGCTGCCC 345 

MIM II I I II II II I I II I II II I I I II I II III I MMI II MM 

TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 
AC CAT GGAG GT C C G CAT T AAT GT CT C AAG GC AG C AGGT C GAGAAGGT GTTCGGGCT GGAG 4 05 

M I I M I M II II I I I M II II I I II I II II II Mill I II II M II II I I I 

ACCAT GGAGGT CCGTAT CAAC GTATCGAGGCAGCAGGTAGAGAAAGT GTTT GGGCT GGAG 360 

GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 4 65 
I M I I M I I M I I I II I I I II I II II I II I I I II I II I II I II I I I I I I I I II I I II 
GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

T AC AT C C G C AT AGC C AGAT T G C GC AAGAACT T C GAGCAGGAG CCGCTGGC C AAGGAGGT G 525 
I M M I M M Ml I I I II II II I I I II II I I II II I I I II I I II I II II III 
TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 4 80 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 
M MM I II II II II || M II M M Mill Mill Ml 

TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

GT GGAGT GGCT CC GGAAC GAGGACCTGGT GGACC C GT C C CT GGAC C C CAAT GT AT ACAT C 64 5 
M M M I II II II I II I M Mill I I I I I M I II II II I I 

GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

M M I I I M II I II II I II I I II I Ml I Ml I 

ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 
M II I I II II II I II I I II II II I II I II II I || | | M II I M I I II II 
T GT GT GGC CAAGAAC AT C GT AG CC C GT C GCC GAAGCAC CT CT G CAGCGGTCAT T GT T TAT 72 0 

GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 
I M M M M I I II M I I I I II I I I II I I II II II I II I I II II I I I M I II I II I II I 
GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 7 8 0 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 88 5 
I M M I I M I I M I M I I I I M I II II II II M II I II I M II I II I II I II I I I III 
GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 84 0 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



886 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

I I I ' I I I I I I I I I I I I I I I M I I I I I I I I I I I ! I II I I I I I I I I I I I I I II II III 

841 T GT GAG G GGCAGAAT GT C C AGAAAACAGC CT GC GC C AC TCT GT GCCC AGT G GAT GGGAG C 900 

94 6 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II 
961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

118 6 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

1141 CT CAT T TACT GT C GCAAGAAG GAAGGGCT G GACT C CGAT GT G GC C GACT C GT C CAT C CT C 1200 

1246 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1305 

M I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

1306 AC CAT C CAGC C GGAC CT C AGC AC C AC C AC C AC C AC CT AC CAGGGC AGT CT C T GT C C C C G G 1365 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 
1261 AC CAT C C AG C C AG AC C T C AG C AC C AC C AC T AC C AC C T AC C AG G G C AGT C TAT GT T C GAG G 1320 

1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

142 6 GGC GGC C GC CACAC ACT GCAC CACAG CT CT C C C AC CT CT GAGG C C GAG GAGT T C GT CT C C 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

148 6 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 41 CGCCTCTCCACCC7VAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1606 AT CCCC CC AGAT GCCATACC CC GAGGGAAGAT CTAT GAGATCT AC CT CACGCT GCACAAG 1665 

II I I I I I M II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AT AC CCCC GGAT GC CAT C C C C C GAG GAAAGAT CT ACGAGAT CT AC CT CACACT G CACAAG 1620 

1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 1680 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 



Db 


1681 


Qy 


1786 


Db 


1741 


Qy 


1846 


Db 


1801 


Qy 


1906 


Db 


1861 


Qy 


1966 


Db 


1921 


Qy 


2026 


Db 


1981 


Qy 


2086 


Db 


2041 


Qy 


2146 


Db 


2101 


Qy 


2206 


Db 


2161 


Qy 


2266 


Db 


2221 


Qy 


2326 


Db 


2281 


Qy 


2386 


Db 


2341 


Qy 


2446 


Db 


2401 


Qy 


2506 


Db 


2461 


Qy 


2566 



1 1 1 1 1 I II II II 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 

TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I III 
GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

GAGGAT GT G CT GC AC C T T GGT GAGGAGT CAC CT T C C CAC CT C TACT ACT GCCAG CT G GAG 18 60 

GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 
Ml I I I I I I I II MINIM I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II 
GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 
I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II II I I I I I I II II 
CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

T C C C T C GAGT ACAAC AT C C G GGT CT ACT G C CT GCAT GAC AC C CAC GAT G C ACT C AAGGAG 2085 
I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I | | | | | | | || I I I | I I I I I 
TCCCTT GAGTACAACAT CCGAGT GTACTGCCTACACGACACCCACGACGCT CTCAAGGAG 204 0 

GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 214 5 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I II I II I I I I I I 
GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

T T C AAG GACAGT T AC C ACAAC CT GC GC CT AT C CAT C CAC GAT GT GC C C AG CT C C CT GT GG 2205 
M M I I I I I I I II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
TTCAAAGACAGTTACCACAACCTACGTCTCTCCATCCACGACGTGCCCAGCTCCCTGTGG 2160 

AAGAGT AAGCT C CT T GT CAG CTAC CAGGAGAT CC C CT T TT AT CAC AT CTGGAAT GGC ACG 2265 
I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 222 0 



I I I I III I I I I I I I I I I I I I I I I I I I I I I I M | | I I I I I I I I I II Mill 



GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 
I I I I I I I I I I I I I I I I I I M I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 234 0 

AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 244 5 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 24 00 

C C AGC C CT GGT GGG C C C C AGT GC CT T CAAGAT CCCCTTCCT C ATT C GGC AGAAGAT AAT T 2 505 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I II 

CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I M I I II 
GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2 625 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 



Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 



Qy 262 6 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2 685 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

Qy 268 6 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 8 






AAV52941 






ID 


AAV52941 standard; cDNA; 1787 BP. 






XX 








AC 


AAV52941; 






XX 








DT 


25-MAR-2 003 (revised) 






DT 


21-DEC-1998 (first entry) 






XX 








DE 


Human UNC-5 homologue unc5h-l cDNA. 






XX 








KW 


UNC-5; UNC5H-1; human; netrin receptor; cell migration; axon guidance; 


KW 


diagnosis; therapy; ds . 






XX 








OS 


Homo sapiens. 






XX 








FH 


Key Location/Qualifiers 






FT 


CDS 3. .1670 






FT 


/*tag= a 






FT 


/transl except= (pos: 


21. . 


22, aa:Xaa) 


FT 


/transl except= (pos: 


200. 


.203, aa:Ile) 


FT 


/transl except^ (pos: 


771. 


.772, aa:Ser) 


FT 


/transl except= (pos: 


785. 


.786, aa:Leu) 


FT 


/transl except^ (pos: 


1078. 


.1079, aa:Xaa) 


FT 


/transl except= (pos: 


1098. 


.1099, aa:Xaa) 


FT 


/transl except= (pos: 


1106. 


.1107, aa:Xaa) 


FT 


/transl except^ (pos: 


1621. 


.1622, aa:Gly) 


FT 


/note= "these codons 


have 


apparent 1 nucleotide deletions 


FT 


or insertions , which 


alter 


the reading frame" 


XX 








PN 


WO9837085-A1. 






XX 








PD 


27-AUG-1998. 






XX 








PF 


19-FEB-1998; 98WO-US003143 . 






XX 








PR 


19-FEB-1997; 97US-00808982 . 






XX 








PA 


(REGC ) UNIV CALIFORNIA. 






XX 








PI 


Tessier-Lavigne M, Leonardo ED, Hinck L, 


Masu M, Keinomasu K; 


XX 








DR 


WPI; 1998-495364/42. 






DR 


P-PSDB; AAW78899. 






XX 








PT 


Netrin-binding, vertebrate proteins - 


useful for diagnosis, therapy and 



PT the biopharmaceutical industry. 
XX 

PS Claim 7; Page 17; 32pp; English. 
XX 

CC This partial cDNA, termed unc5h-l, comprises a human homologue of 
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CC were isolated from an embryonic brain cDNA library. The predicted 

CC proteins (see AAW78899 and AAW78901) show similarity with UNC-5. They are 

CC predicted to be involved in cell migration and axon guidance, and are 

CC characterised as receptor proteins for netrins . Gene expression is 

CC observed in regions where differentiating neurons are undergoing 

CC axogogenesis . Rat unc5h-l (see AAV52940) and unc5h-2 (see AAV52942) cDNAs 

CC are also claimed. Vertebrate UNC-5 proteins may be produced recombinantly 

CC from transfected host cells by utilising these vertebrate UNC-5 nucleic 

CC acids. The invention also provides unc-5 hybridisation probes and 

CC primers, vertebrate UNC-5-specif ic binding agents such as specific 

CC antibodies, and methods of making and using the subject compositions in 

CC diagnosis (e.g. genetic hybridisation screens for vertebrate unc-5 

CC transcripts), therapy (e.g. gene therapy to modulate vertebrate unc-5 
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Qy 


1070 


GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 


1129 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I | | | | | | 




Db 


1 


GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 


59 


Qy 


1130 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


1189 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 I | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


60 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


119 


Qy 


1190 


TT T AT T GC C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CAT T CTCAC CT 


1249 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 




Db 


120 


TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 


179 


Qy 


1250 


C AGG CT T C C AGC C C GT CAGCAT C - AAG C C C AG C AAAGCAGAC AAC C C C C AT CT GCT C AC C 


1308 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


180 


C AGG CT T C C AGC C CGT CAGCAT CTAAGCC CAGCAAAGC AGACAAC C C CC AT CT G CT CAC C 


239 


Qy 


1309 


ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 


1368 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 




Db 


240 


ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 


299 


Qy 


1369 


GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 


1428 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I I I I I I I I I I | | | | | | M | | | | | M 1 1 1 1 1 




Db 


300 


GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 


359 


Qy 


1429 


GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 


1488 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 




Db 


360 


GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 


419 



Qy 14 8 9 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 42 0 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 47 9 

Qy 154 9 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 48 0 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 C C C C C AGAT GC CAT AC C C C GAG GGAAGAT CT AT GAG AT C T AC CT C AC G CT GC AC AAGC C G 1668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 54 0 CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCG 599 

Qy 1669 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1728 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 172 9 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 17 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 178 9 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 18 48 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I 

Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CT C GAGT AC AAC AT CC G GGT CTAC T GC CT G CAT GAC AC C CAC GAT G CACT CAAGGAG GT G 2088 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 CT C GAGT AC AAC AT C C GGGTCTACT GCCT G CAT GAC AC C CAC GAT G CACT CAAG GAG GT G 1017 

Qy 208 9 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

Qy 214 9 AAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAG 22 08 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1077 AAGGAC AGT T ACCACAAC CT — GC C CTAT CAT CCAC GAT GTGC C CAGCT C C CT GT GGAAG 1134 

Qy 2209 AGT AAGCT C CT T GT C AG CTAC C AGGAGAT C C C CT T T TAT CAC AT CT GGAAT G GC AC GC AG 2268 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1135 AGT AAGCT C CT T GT CAGCT AC C AGGAGAT CC C CT T T TAT CAC AT CT GGAAT G GC AC G C AG 1194 

Qy 2269 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 



Qy 2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

1 1 I 1 1 1 1 I 1 1 I 1 1 I 1 1 I 1 1 1 1 I I I I 1 1 I I I I 1 1 1 I I I 1 1 I I 1 1 1 1 1 I I I 1 1 1 I i I I I I I I 

Db 1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

Qy 2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTG7\AGCGGGGGTCCCA 1374 

Qy 2449 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGAT7^ATTTCC 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 

Qy 2569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 262 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1495 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 1554 

Qy 2 629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I II I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

Qy 2747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 168 0 



RESULT 9 
AAC90958 

ID AAC90958 standard; cDNA; 9700 BP. 
XX 

AC AAC90958; 
XX 

DT 19-MAR-2001 (first entry) 
XX 

DE Plasmid pGC1037 nucleotide sequence SEQ ID NO: 91. 
XX 

KW Human; Caenorhabditis elegans; UNC-5; splice variant; nematode worm; 

KW protein-protein interaction; identification; ss. 

XX 

OS Synthetic. 
XX 

PN WO200073328-A2. 
XX 

PD 07-DEC-2000. 
XX 

PF 02-JUN-2000; 2000WO-EP005108 . 
XX 

PR 01-JUN-1999; 99GB-00012755 . 
XX 

PA (DEVG-) DEVGEN NV. 



XX 

PI Van Criekinge W, Roelens I, Bogaert T, Verwaerde P; 
XX 

DR WPI; 2001-016508/02. 
XX 

PT Three variants of human unc- 5C cDNAs (unc- 5Cb, unc— 5Cc and. unc- 5C8) and a 

PT human unc-5HSl cDNA, useful in yeast two hybrid experiments for 

PT identifying unknown human cDNAs which encode proteins that interact with 

PT the human unc-5C protein. 

XX 

PS Example 4; Page 228-230; 246pp; English. 
XX 

CC The present invention describes 3 variants of human unc-5C cDNAs (unc- 

CC 5Cb, unc-5Cc and unc-5C8) which correspond to alternatively spliced unc- 

CC 5C transcripts, and a human unc-5HSl cDNA which shares homology with the 

CC Rattus norvegicus unc-5HSl cDNA. Also described are assays based on 

CC protein-protein-interactions between the unc-5 protein and a variety of 

CC different interacting proteins. The unc— 5C variant cDNAs and unc— 5HS1 

CC cDNA are useful in methods for identifying compounds which reduce or 

CC inhibit the lethal phenotype associated with the expression of the unc-5 

CC death domain in yeast. They are also useful in yeast two hybrid 

CC experiments for identifying unknown human cDNAs which encode proteins 

CC that interact with the human unc-5C protein. AAC90914 to AAC90971 and 

CC AAB50646 to AAB50693 represent sequences used in the exemplification of 

CC the present invention 

XX 

SQ Sequence 9700 BP; 2604 A; 2193 C; 2236 G; 2666 T; 0 U; 1 Other; 

Query Match 47.4%; Score 1304.2; DB 4; Length 9700; 

Best Local Similarity 99.8%; Pred. No. 2.1e-242; 

Matches 1306; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1437 CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 1496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 66 

Qy 14 97 CCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAA 1556 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 
Db 67 CCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAA 126 

Qy 1557 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 127 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCAGA 18 6 

Qy 1617 TGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGT 1676 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 187 TGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGT 246 

Qy 1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 247 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 306 

Qy 1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 307 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 366 



Qy 



1797 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 367 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 42 6 

Qy 1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | I I I I 
Db 427 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 486 

Qy 1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1976 

I I I M I I I I I I I I I I I I M I I I I I I I I I I I II I II I I I I I I I I Ill 

Db 487 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 54 6 

Qy 1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 547 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 606 

Qy 2 037 CAACAT C CGGGT CT ACTGCCT GCAT GACAC CCACGATGCACT CAAGGAGGT GGT GCAGCT 2096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 607 CAACAT C CGGGT CT ACT GCCT GCAT GACAC C CAC GAT GCACT CAAGGAGGT GGT GCAGCT 666 

Qy 2 097 G GAGAAG CAGCT GGGGG GACAGCT GAT C CAGGAGCC AC GGGT CCT G C ACTT CAAG GACAG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 667 GGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAG 726 

Qy 2157 TTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 727 T T AC CACAAC CT GC GC CT AT C CAT CCAC GAT GT GC CC AGCT C C C T GT GGAAGAGTAAG CT 786 

Qy 2217 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2276 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 7 87 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 846 

Qy 2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 847 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 906 

Qy 2337 GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTTCAGCATCAACTT CAACAT CACCAA 2396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 907 GTGGGT GT GGCAGGT GGAGGG CGAC GGGCAGAGCT T C AGCAT CAACT T CAACAT CAC CAA 966 

Qy 2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 967 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCAAGCCCTGGT 1026 

Qy 2457 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1027 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 1086 

Qy 2517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2576 

I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1087 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 1146 

Qy 2577 C CAT CT C AGCT T CTTTGCCTC CAAG C C CAG C C C CAC AG C CAT GAT CCT C AAC CT GT GGGA 2636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 114 7 C CAT CT CAGCT TCTTTGCCTC C AAGC C C AGC C C C AC AGC CAT GAT CCT CAAC CT GT G GGA 1206 

Qy 2637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1207 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 1266 



Qy 2697 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1267 C CAGCCAGACGCT GGCCT CTT CACAGT GT CGGAGGCT GAGT GCT GAGT C 1315 



RESULT 10 
AAH99530 

ID AAH99530 standard; cDNA; 1321 BP. 
XX 

AC AAH99530; 
XX 

DT 16-OCT-2001 (first entry) 
XX 

DE Human protein encoding cDNA sequence SEQ ID NO: 365. 
XX 

KW Human; cancer; ulcer; HIV infection; human immunodeficiency virus; 

KW antiinflammatory; antirheumatic; antiarthritic; immunosuppressive; 

KW antibacterial; endocrine; cardiant; central nervous system; virucide; 

KW anti-HIV; fungicide; antimutagen; cardiovascular; antianaemic; anaemia; 

KW antiaggregant; haemostatic; vulnerary; antiulcer; osteopathic; eczema; 

KW dermatological; antiallergic; antiasthmatic; antidiabetic; cytostatic; 

KW neuroprotective; antidepressant; nootropic; antiparkinsonian; infection; 

KW immunostimulant ; gene therapy; antisense therapy; vaccine; inflammation; 

KW antianaphylactic; rheumatoid arthritis; septic shock; pancreatitis; 

KW cardiac dysfunction; neuropathology; cardiac anaphylaxis; autoimmunity; 

KW genetic disease; haematopoietic disorder; platelet disorder; asthma; 

KW thrombocytopaenia; osteoporosis; severe combined immunodeficiency; 

KW allergic rhinitis; diabetes; multiple sclerosis; depression; 

KW Alzheimer's disease; Parkinson's disease; neurodegenerative disorder; 

KW neurological disorder; ss. 

XX 

OS Homo sapiens. 
XX 

PN WO200153455-A2. 
XX 

PD 26-JUL-2001. 
XX 

PF 22-DEC-2000; 2000WO-US035017 . 
XX 

PR 23-DEC-1999; 99US-00471275 . 

PR 21-JAN-2000; 2000US-00488725 . 

PR 25-APR-2000; 2000US-00552317 . 
XX 

PA (HYSE-) HYSEQ INC. 
XX 

PI Tang YT, Liu C, Drmanac RT; 
XX 

DR WPI; 2001-457603/49. 

DR P-PSDB; AAM25589. 
XX 

PT Isolated human polynucleotides encoding polypeptides, useful for the 

PT treatment and diagnosis of e.g. cancer, ulcers and HIV infection. 
XX 

PS Claim 1; Page 471; 1217pp; English. 
XX 



CC AAH99166 to AAH99904 encode the human proteins given in AAM25225 to 

CC AAM25963. The proteins can have activities based on the tissues and cells 

CC they are expressed in, such as: antiinflammatory; antirheumatic; 

CC antiarthritic; immunosuppressive; antibacterial; endocrine; cardiant; 

CC central nervous system; virucide; anti-HIV; fungicide; antimutagen; 

CC cardiovascular; antianaemic; antiaggregant ; haemostatic; vulnerary; 

CC antiulcer; osteopathic; dermatological ; antiallergic; antiasthmatic; 

CC antidiabetic; cytostatic; neuroprotective; antidepressant; nootropic; 

CC antiparkinsonian; and immunostimulant . The proteins and polynucleotides 

CC encoding them can be used in gene therapy,, antisense therapy and vaccine 

CC production, The proteins and polynucleotides are useful for screening for 

CC agonists or antagonists of a protein and for the treatment and diagnosis 

CC of disorders associated with the activity of a protein e.g. inflammation, 

CC rheumatoid arthritis, septic shock, pancreatitis, cardiac dysfunction, 

CC neuropathology, cardiac anaphylaxis, viral, bacterial, HIV and fungal 

CC infections, autoimmunity, genetic diseases, haematopoietic disorders, 

CC anaemia, platelet disorders, thrombocytopaenia, wounds, burns, ulcers, 

CC osteoporosis, severe combined immunodeficiency, eczema, allergic 

CC rhinitis, asthma, diabetes, cancer, multiple sclerosis, depression, 

CC Alzheimer's disease, Parkinson's disease, neurodegenerative and 

CC neurological disorders 

XX 

SQ Sequence 1321 BP; 258 A; 440 C; 371 G; 252 T; 0 U; 0 Other; 



Query Match 43.8%; Score 1206.6; DB 4; Length 1321; 

Best Local Similarity 98.0%; Pred. No. l.le-223; 

Matches 1295; Conservative 0; Mismatches 19; Indels 7; Gaps 7; 



Qy 


1435 


CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 


1494 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 




Db 


1 


CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 


60 


Qy 


1495 


ACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTC 


1554 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I 




Db 


61 


ACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTC 


120 


Qy 


1555 


AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCA 


1614 






1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 




Db 


121 


AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCA 


180 


Qy 


1615 


GATGCCATAC CCCGAGGGAAGAT CTAT GAGAT CTACCTCACGCTGCACAAGCCGGAAGAC 


1674 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | 




Db 


181 


GAT G C CAT AC C C C GAG G G AAG AT C TAT GAGAT C T AC C T C AC G C T G C AC AAG C C G G AAG AC 


240 


Qy 


1675 


GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 


1734 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 


.300 


Qy 


1735 


CCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT-GGCTATGGACCACTGT-GGGGAGCCC 


1791 






M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 




Db 


301 


CCTGGGCGTCCTGCTTACCCGGCCAGTCATCCTGGGGTATGGACCACTGTGGGGGAGCCC 


360 


Qy 


1792 


AGCCCTGACAGCT-GGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 


1850 






1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


AGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 


420 


Qy 


1851 


TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 


1910 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 421 TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 4 80 

Qy 1911 TGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAG 1970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 TGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGCTATGCCCTGGTGGGAGAGGCCCTCAG 540 

Qy 1971 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 2030 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I I I I I 
Db 541 CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 600 

Qy 2 031 CGAGT ACAACAT CC GGGT CTACT GCCT GCAT GACACCCAC GAT GCACT CAAGGAGGT GGT 2090 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I 
Db 601 CGAGT ACAACAT ACT GGT CTACT GCCT GCATGACACT CACGAT GCACT CAACGTAGT GGT 660 

Qy 2 091 GCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAA 2150 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 661 GCAGCTGGAGAAGCAGCTGCAGGGACAGCTGATCCAGGAGCCACTGGTACTGCACTTCAA 720 

Qy 2151 GGACAGTTACCACAAC CT GCGCCTATC CAT CCACGAT GT GCCCAGCTCCCT GT GGAAGAG 2210 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I | | | | | 
Db 721 GGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAG 780 

Qy 2211 TAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCG 2270 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 781 TAAGCT C CT T GT C AG CT AC CAG GAGAT CC C CT T T TAT CACATCT GGAAT GGCAC GC AGC G 840 

Qy 2271 GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 2330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 900 

Qy 2331 CAAGCT GT G G GT GT G G CAGGT G GAGGG CGACGGGCAGAG CT TCAGCAT CAACT T CAACAT 2390 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 901 CAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACAT 960 

Qy 2391 CACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGC 2450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | 
Db 961 CAC CAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT CCCAGC 1020 

Qy 2 451 CCTGGTGGGCCCCAGTGCCTTC7VAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 2510 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
Db 1021 CCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 1080 

Qy 2511 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 2570 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 1140 

Qy 2571 GGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCT 2630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCT 1200 

Qy 2 631 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT-G 2689 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 1201 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGG 1260 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCCG 2747 

I I I I I I I I I I I I I I I I MM II II II I I I II I I II II II II I M M II I I I M I 



Db 1261 GACTGGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCCG 1320 



Qy 2748 G 2748 

I 

Db 1321 G 1321 



RESULT 11 
AAS75738 

ID AAS75738 standard; cDNA; 3646 BP. 
XX 

AC AAS75738; 
XX 

DT 13-FEB-2002 (first entry) 
XX 

DE DNA encoding novel human diagnostic protein #11542. 
XX 

KW Human; chromosome mapping; gene mapping; gene therapy; forensic; 

KW food supplement; medical imaging; diagnostic; genetic disorder; ss . 
XX 

OS Homo sapiens . 
XX 

PN WO200175067-A2. 
XX 

PD ll-OCT-2001. 
XX 

PF 30-MAR-2001; 2001WO-US008631 . 
XX 

PR 31-MAR-2000; 2000US-00540217 . 

PR 23-AUG-2000; 2000US-00649167 . 
XX 

PA (HYSE-) HYSEQ INC. 
XX 

PI Drmanac RT, Liu C, Tang YT; 
XX 

DR WPI; 2001-639362/73. 

DR P-PSDB; ABG11551. 
XX 

PT New isolated polynucleotide and encoded polypeptides, useful in 

PT diagnostics, forensics, gene mapping, identification of mutations 

PT responsible for genetic disorders or other traits and to assess 

PT biodiversity. 
XX 

PS Claim 1; SEQ ID NO 11542; 103pp; English. 
XX 

CC The invention relates to isolated polynucleotide (I) and polypeptide (II) 

CC sequences. (I) is useful as hybridisation probes, polymerase chain 

CC reaction (PCR) primers, oligomers, and for chromosome and gene mapping, 

CC and in recombinant production of (II) . The polynucleotides are also used 

CC in diagnostics as expressed sequence tags for identifying expressed 

CC genes. (I) is useful in gene therapy techniques to restore normal 

CC activity of (II) or to treat disease states involving (II). (II) is 

CC useful for generating antibodies against it, detecting or quantitating a 

CC polypeptide in tissue, as molecular weight markers and as a food 

CC supplement. (II) and its binding partners are useful in medical imaging 

CC of sites expressing (II). (I) and (II) are useful for treating disorders 

CC involving aberrant protein expression or biological activity. The 



CC polypeptide and polynucleotide sequences have applications in 

CC diagnostics, forensics, gene mapping, identification of mutations 

CC responsible for genetic disorders or other traits to assess biodiversity 

CC and to produce other types of data and products dependent on DNA and 

CC amino acid sequences. AAS64 197-AAS94564 represent novel human diagnostic 

CC coding sequences of the invention. Note: The sequence data for this 

CC patent did not appear in the printed specification, but was obtained in 

CC electronic format directly from WIPO at 

CC ftp . wipo . int/pub/published_pct_sequences 

XX 

SQ Sequence 3646 BP; 930 A; 917 C; 921 G; 877 T; 0 U; 1 Other; 

Query Match 35.2%; Score 970; DB 5; Length 3646; 

Best Local Similarity 61.3%; Pred. No. 6.6e-178; 

Matches 1680; Conservative 1; Mismatches 996; Indels 63; Gaps 5; 

Qy 57 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 116 

I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 220 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 27 9 

Qy 117 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 17 6 

II I I I I I I I I I I I I I I I I I I I I I 

Db 28 0 TGATGACTTTTTTCATGAACTCCCAGAAACTTTTCCTTCTGATCCACCTGAGCCTCTGCC 339 

Qy 17 7 C CACT T C CT GGT GGAGCC C GAGGAT GTGT AC AT C GT CAAGAACAAG C CAGT GCTGCTTGT 236 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 34 0 ACAT T T CCT T AT T GAGC CT GAAGAAGCT TAT AT T GT GAAGAAT AAG CCT GT GAAC CT GT A 399 

Qy 237 GTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCA 296 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 400 CT GTAAAGCAAGCCCT GCCACCCAGATCTATTTCAAGTGTAATAGT GAAT GGGTT CATCA 4 59 

Qy 297 GGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGT 356 

I I I I I I I I I I II II I I I I I I I I I I I I I I I 

Db 460 GAAGGACCACATAGTAGAT GAAAGAGT AGAT GAAACTT CCGGT CT CATT GT CCGGGAAGT 519 

Qy 357 CCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTG 416 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 0 GAGCATTGAGATTTCGCGCCAGCAAGTGGAAGAACTCTTTGGACCTGAAGATTACTGGTG 57 9 

Qy 417 C CAGT GCGT GGCAT GGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGC CTACATCCGCAT 476 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I MINI II I I I I I I 

Db 58 0 CCAGTGTGTGGCCTGGAGCTCCGCGGGTACCACAAAGAGCCGGAAGGCGTATGTGCGCAT 639 

Qy 477 AGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCA 536 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 0 T GCATAT C T AC GGAAGAC ATTT GAGCAGGAAC C CCT AGGAAAGGAAGT GT CT T T GGAAC A 699 

Qy 537 GGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCT 596 

II MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 700 GGAAGTCTTACTCCAGTGTCGACCACCTGAAGGGATCCCAGTGGCTGAGGTGGAATGGTT 759 

Qy 597 C C GGAAC GAGGAC CT GGT G GAC CCGTCCCTG GAC C C C AAT GT AT AC AT CAC GC GGGAGC A 656 

M I I I I I I I I I I I III I I I I I I I I I I I I I I 

Db 760 GAAAAAT GAAG AC AT AAT T GAT C C C GT T GAAG AT C G GAAT T T T TAT AT TACT AT T GAT C A 819 



Qy 657 CAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAA 716 



82 0 CAAC CT CAT CAT AAAGCAGGC C C GACT C T CT GAT ACTG CAAAT T AC AC C T GT GT T G CCAA 87 9 

717 GAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGG 776 

I I I I I I I I I I II I Ml I I I I I I I I I I I I I I I I I I I I I I 

880 AAAC ATT GT T GC CAAGAG GAAAAGT ACAACT GC C AC T GT CATAGT C TAT GT CAAC G GT GG 939 

777 GTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAA 836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
940 CTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTATCAGAA 999 

837 ACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCA 896 
I I I I III II I I I I I I I I I I I II I I I I! I I I I I II I I I I II I I I I I I I 
1000 ACGTACAAGGACTTGTACCAACCCGGCACCACTCAATGGGGGTGCCTTCTGTGAAGGGCA 1059 

8 97 GAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTG 956 
I I I I I I I II I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I I I I 
1060 GAGTGT GCAGAAAAT AGCCT GT ACTACGTTAT GCC CAGTGGAT GGCAGGT GGACGCCAT G 1119 

957 GAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGA 1016 

I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I 

1120 GAGCAAGT GGT CT ACTT GT GGAACT GAGT GCACCCACT GGCGCAGGAGGGAGT GCACGGC 117 9 

1017 CCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTG 1076 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1180 GCCAGCCCCCAAGAATGGAGGCAAGGACTGCGACGGCCTCGTCTTGCAATCCAAGAACTG 1239 

1077 TACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG 1136 

II II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1240 CACTGATGGGCTTTGCATGCAGACTGCTCCTGATTCAGATGATGTTGCTCTCTATGTTGG 1299 

1137 CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTA 1193 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1300 GATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTTTGTGTA 1359 

1194 TTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGG 1253 

II Ml I I I I I I I I I I I I I I I I I I I I I I I I II 
1360 T C G GAAGAAT C AT CGT GACT TT GAGT CAGATAT TAT T GACT CT T CGG CACT CAAT GGGG G 1419 

1254 CTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCA 1313 

I I I I I : I I I I I I I I I I I I I I I I I I I I I I II I I II 

1420 CT T T CARC CT GT GAAC AT CAAG GCAGCAAGACAAGATCTGCTGGCTGTACC 147 0 

1314 GCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATG- 1372 

I I I I I I I I I I I I III III II I I I I I I I I I I I I I I 
1471 CC CAGACCT CAC GT CAG CT GC AGC C AT GT AC AGAGGAC CT GT CTAT GC C C T GC AT GAC GT 1530 

1373 GGCCCAGCCCCAAGTTCCAGCT CAC CAAT GGGCACCTGCTCAGCCCCCTGGG 1424 

II I I I I I I I II I I I I I I I I I I I I I I I I I I 

1531 CT CAGAC AAAAT C CCAAT GAC CAACT CT CCAAT T CT GGAT CC ACT G C CCAAC CT GAAAAT 1590 

1425 T GGC G GC C GC C AC AC AC T G CAC C AC AGCT CT C C CAC CT CT G AGGC C GAG GAGT T C GT CT C 1484 

I I I I I I I I I I I I III I I I I I I II 

1591 CAAAGT GT ACAACACCT CAGGT G CT GT CT C CC C CCAAGAT GAC CT CT CT GAGT T T ACGT C 1650 



14 85 CCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGA 154 0 

I I MM | I II I II I I I I I I 



Db 1651 CAAGCT GT CCCCT CAGAT GACCCAGT C GTT GTT GGAGAAT GAAGC CCT CAGCCT GAAGAA 1710 

Qy 1541 CCTATGGGACCTTCAACTTCCT 1562 

I I I I I I I I II I I I I II 

Db 1711 CCAGAGTCTAGCAAGGCAGACTGATCCATCCTGTACCGCATTTGGCAGCTTCAACTCGCT 1770 

Qy 1563 CGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCCAT 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1771 GGGAGGTCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGGGGCCAT 1830 

Qy 1623 AC C CC GAGGGAAGAT C TAT GAGAT CT AC CT CAC GCT GCACAAGCC GGAAGAC GT GAGGT T 1682 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 

Db 1831 T C C C CAAGGGAGAGT CTAC GAAAT GT AT GT GACT GT ACACAGGAAAGAAACT AT GAGGC C 18 90 

Qy 1683 GCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGT 1742 

I I I I I I I I I I I II I I I I III II I I I I I I I I I I I I I I I I I I I 

Db 1891 ACCCATGGATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCCAGGAGC 1950 

Qy 1743 CCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAG 1802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I III 

Db 1951 TCTGCTCACCCGCCCCGTCGTCCTCACTATGCATCACTGCGCAGACCCCAATACCGAGGA 2010 

Qy 18 03 CTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCT 18 62 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 011 CT G GAAAAT ACT GCT CAAGAAC CAG GCAGC AC AGGGACAGT G GGAG GAT GT G GT GGT GGT 2070 

Qy 1863 GGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGT 1922 

I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 071 CGGGGAGGAAAACTTCACCACCCCCTGCTACATTAAGCTGGATGCAGAGGCCTGCCACAT 2130 

Qy 1923 CTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGC 1982 

I I I I I I I I I I I II II I I I I I I I I I I I I II III I I I I I I 

Db 2131 CCTCACAGAGAACCTCAGCACCTACGCCCTGGTAGGACATTCCACCACCAAAGCGGCTGC 2190 

Qy 1983 CAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACAT 2042 

I I I I I I I I I I I I I I I I I I II III II I I I I I I I I I I I I I I I I I I I I 

Db 2191 AAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTACAGCAT 2250 

Qy 2 043 C C GGGT CT ACT GC CT G CAT GACAC C CAC GAT GC ACT C AAGGAGGT GGT GC AGC T GGAGAA 2102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2251 C C G AGT C T AC T GT C T G GAT GACAC C CAG GAT G C C C T G AAG GAAAT T T T AC AT C T T GAG AG 2310 

Qy 2103 GCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCA 2162 

III I I I I I I I I I I I I I I I I I II II II II II I III III 

Db 2311 ACAGAC G GGAGGACAGCT C CT AGAAGAAC CTAAG GCT CTT CAT TTT AAAGGCAGCAC CCA 2370 

Qy 2163 CAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGT 2222 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2371 CAACCTGCGCCTGTCAATTCACGATATCGCCCATTCCCTCTGGAAGAGCAAATTGCTGGC 2430 

Qy 2223 CAG CTAC CAG GAGAT C C C CT T T TAT CAC AT CT GGAAT G GC AC G C AGC G GT ACT T GC ACT G 2282 

I I I I I I I I II I I I I II I I I I I II I I I I III I MINIMI 

Db 2431 T AAAT AT CAG GAAAT T C CAT T T T AC CAT GT T T G G AGT G GAT C T C AAAG AAAC C T G CAC T G 2490 

Qy 2283 CACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGT 2342 

II II I II I I II M I I | | | | I I I I I I I I I II Mil II II II 

Db 2491 CACCTTCACTCTGGAAAGATTTAGCCTGAACACAGTGGAGCTGGTTTGCAAACTCTGTGT 2550 



Qy , 2 343 GT GGC AG GT G GAGGGC GAC G GGCAGAGCT T CAGCAT CAACT T CAAC AT C AC CAAGGAC AC 24 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2551 GCGGCAGGT GGAAGGAGAAGGGCAGAT CTT CCAGCT CAACT GCACCGTGT CAGAGGAACC 2610 

Qy 2403 AAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCC 2462 

! I I I I I I Mill II I I I I I I I I I I 

Db 2 611 TACTGGCATCGATTTGCCGCTGCTGGATCCTGCGAACACCATCACCACGGTCACGGGGCC 2670 

Qy 2 463 C AGT GC CTT C AAGAT CCCCTTCCT CAT T C G GC AG AAGAT AAT T T C C AGC CT G GAC C C AC C 2522 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I III 
Db 2 671 CAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGATGCCCC 2730 

Qy 2 523 C T GT AG GCGGGGTGCC GACT GGC GGACT C T G GC C CAGAAACT C C AC CT GGAC AG C CAT CT 2582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 731 CCAGACGAGAGGC CAT GACT GGAGGAT GCT GGCCCATAAGCTGAACCTGGACAGGTACTT 2790 

Qy 2583 CAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCG 2642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 27 91 GAATTACTTTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGAAGCACA 2850 

Qy 2 643 GCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCC 2702 

I II I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 
Db 2 851 GAACTT C CC AGAT GGAAAC CT GAGCAT GCT GGCAGCT GT CT T GGAAGAAAT GGGAAGACA 2910 

Qy 2703 AGAC GCT GGC CT CTT CACAGT GT C GGAGGCT GAGT GCT GA 2742 

I I I I I I I I I I I I I I I I I I 
Db 2 911 TGAAACGGTGGTGTCCTTAGCAGCAGAAGGGCAGTATTAA 2950 



RESULT 12 
ABT06279 

ID ABT06279 standard; cDNA; 2860 BP. 
XX 

AC ABT06279; 
XX 

DT 24-OCT-2002 (first entry) 
XX 

DE Human NOVla coding sequence. 
XX 

KW Human; NOVX; autoimmune disease; cancer; infection; inflammatory disease; 

KW storage disorder; muscle disorder; neurodegenerative disorder; nootropic; 

KW developmental defect; neuroprotective; antiparkinsonian; hypotensive; 

KW hypertensive; haemostatic; cardiant; antianginal; dermatological ; 

KW immunosuppressive; antiinflammatory; virucide; antibacterial; anti-HIV; 

KW antiparasitic; antiallergic; antiasthmatic; antirheumatic; antiarthritic; 

KW vulnerary; anorectic; antidiabetic; immunomodulator ; antipsoriatic; 

KW nephrotropic; kerolytic; antiulcer; cerebroprotective; anticonvulsant; 

KW antiinf ertility; antimanic; antidepressant; metabolic; cytostatic; 

KW tranquilizer; analgesic; gene; ss. 

XX 

OS Homo sapiens. 
XX 

PN WO200257450-A2. 
XX 

PD 25-JUL-2002. 
XX 



PF 29-NOV-2001; 2001WO-US048922 . 
XX 

PR 29-NOV-2000; 2000US-0253834P . 

PR 30-NOV-2000; 2000US-0250926P . 

PR 25-JAN-2001; 2001US-0264180P . 

PR 20-AUG-2001; 2001US-0313656P . 

PR 05-OCT-2001; 2001US-0327456P . 

PR 28-NOV-2001; 2001US-00327456 . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Edinger S, Macdougall JR, Millet I, Ellerman K, Stone DJ; 

PI Gerlach V, Grosse WM, Alsobrook JP, Lepley DM, Rieger D, Burgess CE; 

PI Casman SJ, Spytek KA, Boldog FL, Li L, Padigaru M, Mishra V; 

PI Patturajan M, Shenoy S, Rastelli L, Tchernev VT, Vernet CAM; 

PI Zerhusen BD, Malyankar UM, Guo X, Miller CE, Gangolli EA; 

XX 

DR WPI; 2002-590741/63. 

DR P-PSDB; AA018734. 
XX 

PT Novel isolated polypeptide, designated NOVX, useful for treating or 

PT preventing in NOVX-associated disorders e.g. cardiomyopathy, 

PT atherosclerosis, diabetes, cancer, allergy, asthma, Crohn 1 s disease. 

XX 

PS Claim 9; Page 11; 353pp; English. 
XX 

CC The present invention provides the protein and coding sequences of 

CC several novel human proteins, designated NOVX. These can be used in the 

CC treatment of, amongst others, cancers, autoimmune diseases, infections, 

CC inflammatory diseases, storage disorders, muscle disorders, 

CC neurodegenerative diseases and developmental defects. The present 

CC sequence is a coding sequence of the invention 

XX 

SQ Sequence 2860 BP; 555 A; 950 C; 860 G; 495 T; 0 U; 0 Other; 



Query Match 34.0%; Score 936.2; DB 6; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 2.2e-171; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 203 T G T AC AT C GT CAAGAAC AAG C CAGT GCTGCTTGTGTG C AAGG C C GT GC C C GC CAC G C AGA 262 

I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I 

Db 228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 2 63 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 2 88 T CT ACT T CAAGT GCAAC GG C GAGT GGGT CAGCCAGAACGAC CAC GT C ACACAGGAAGGCC 347 

Qy 323 CAGACGGGAGCAGT GGGCT GCCCACCAT GGAGGT C CGCATTAAT GT CT CAAGGCAGCAGG 382 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 348 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I III II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 



Db 4 08 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 467 

Qy 44 3 G C AC C AC C AAGAGT C AGAAG G C C T AC AT C C G CAT AG C C AG AT T G C G C AAG AAC T T C GAG C 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I I I I I I I I 

Db 468 GCACCACCAAGAGTCGCCGAGCCTACGTCCGCATCGCCTACCTGCGCAAGAACTTCGATC 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I M M I I I II I I I I I I I I I I I I I II I I I I I I I I I 
Db 528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 588 CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 647 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 8 C C CAGGAC AC CAACT T C CT G CT C AC CAT C GAC C AC AAC C T CAT CAT C C GC CAGGC C CGC C 707 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I Mill III 

Db 708 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 767 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

Qy 803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 8 63 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II MINIM || || I I I I I I I I I I Ml I I I I I I I II I I I I I I III 

Db 888 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 948 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

Qy 983 ACT GCAC C C ACT G GC GGAGC C GT GAGT GCT CT GAC C C AG C AC C C C GC AAC G GAG GGGAGG 1042 

Ml I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

Qy 1043 AGTGCCAGGGCACTGACCTGGACACCCGC7VACTGTACCAGTGACCTCTGTGTACACAGTG 1102 

I I I I I I I I I I I I I I I I I I I I I II I I I I III I 

Db 1068 ACTGCAGCGGGACGCT GCT CGACTCTAAGAACT GCACAGAT GGGCT GT GCAT GCAACT GG 1127 

Qy 1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I Ill II 

Db 1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

Qy 1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

III II II I I I I I I I I I I I I I I I I I I I I 

Db 1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

Qy 1223 ATGTGGCTGACTCGTCCATT CT C AC CT C AGGCT T C C AG C C C GT C AG CAT CAAGC C C A 1279 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1248 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 



Qy 1280 G CAAAG CAGAC AAC C C C CAT CT G CT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I I I I I I I I I I II II I I I I II I I III I 

Db 1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

Qy 1334 C C AC C AC CT AC CAG G GC AGT CTCTGTCCCCG GC AGGA 1370 

II I I I I I I I II MINIMUM 

Db 1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATCCCCATGA 1427 

Qy 1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I II I I I I I I I I I II 
Db 1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 14 87 

Qy 1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I III 

Db 14 88 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

Qy 1448 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I III III- I II II I I I II 

Db 1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

Qy 1508 TCCGCTC CCTGCCCC GAG G C AC CAG C AAC AT G AC C TAT G G G AC C T 1552 

I I I I I I I I I I II I II I I I MM I I II I I I 

Db 1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

Qy 1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I II II II I I I II I I II I I I I I I I I I I I I II I MM 

Db 1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

Qy 1613 CAGAT GCCAT ACCCCGAGGGAAGAT CT AT GAGAT CTACCTCACGCT GCACAAGC C GGAAG 1672 

I M I I II I I I I II M I I I II I II II II I I I I I I II I I I 

Db 1728 AT GGAGCCATT CCC CAGGGCAAGTTCT AC GAGATGTAT CT ACT CAT CAACAAGGCAGAAA 1787 

Qy 1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I II II II I I I I I I I I I II I I I I I I I I II I I I 

Db 17 8 8 GT ACC CT GC C G CTT T CAGAAGGGAC C C AGACAGT AT T GAGC CC CT C GGT GAC CT GT GGAC 1847 

Qy 1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 

I II I I II I M I I I I II I II I I II I I I I I I I I II I II I I II II 
Db 18 4 8 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

Qy 1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I I I I I II I I M I II MM I I I I I I I II I I II I II 

Db 1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

Qy 1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I I I I I I I I II I II I I II I I I I II I I I II I I I I I I I II II 

Db 1968 TGGTGACCCTGGATGAGGAGACCCTGAACACACCCTGCTACTGCCAGCTGGAGCCCAGGG 2027 

Qy 1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

II I I II I II I II II II I II I II I I I II II I II I 

Db 2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 



Qy 

Db 



1973 
2088 



2032 
2147 



Qy 2033 AGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGC 2092 

I I I I I I I I I I I I I I I I -I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

Qy 2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

I I I I I I M I MINIMI | | | | | | | | | | || | I I I I I I 

Db 2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

Qy 2153 ACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTA 2212 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I | I | | | | Ml I I I I I I I I 

Db 2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 

Qy 2213 AGCT C CTT GT C AGCT AC C AGGAGAT C C C C T T T TAT C AC AT C T G GAAT GGCAC GC AG C GGT 2272 

I I I I II I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I Mill III I 
Db 2328 AGCTGCTGGCCAAATACCAGGAGATCCCCTTCTATCACATTTGGAGTGGCAGCCAGAAGG 2387 

Qy 2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I I I I I I I I I I I II I I I I I I I I I I III I | | | M M II 

Db 238 8 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2 447 

Qy 2333 AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 2392 

I I I I I I I I I I I I I I I I I I II I I II I 

Db 244 8 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 

Qy 2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2449 

IN III II II I II I I I I 

Db 2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

Qy 24 50 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I II 
Db 2568 C C CAGCT GGGAC CTT AT GC CTT CAAGAT C C C ACT GT C CAT C CGC C AGAAGAT AT GCAACA 2627 

Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 262 8 GC C T AGAT G C CC C CAACT C ACGGGGCAAT GACT G GCGGAT GT TAGCAC AGAAGCT CT CT A 2687 

Qy 2570 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 
Db 268 8 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I 

Db 274 8 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

M M I I I I I I I I I I I I I I 

Db 2808 AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2 860 
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Length 2860; 

Indels 93; Gaps 7; 



143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

III IN II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

168 AC T CCT T C C C GT CAGC GC CAGCAGAGC C G CT GC C CT ACTT CCT GCAG GAG C CAC AGGAC G 227 

2 03 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 262 

I I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I II I I I I 
228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II 
288 T CT ACT T CAAGT GCAAC GGC GAGT GG GT C AGCCAGAAC GAC CAC GT CACAC AGGAAGGCC 347 

323 CAGAC G G GAG CAGT GGGCTGCC CAC C AT GGAG GT C C GC AT T AAT GT C T C AAGG CAGC AG G 382 

MM I I II MM II I M I II I I I II I I II II II I 

348 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I I I I II I II I II II I M I II I II II II II II II II II II I I II I II I II I I 

408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 467 

443 GCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGC 502 

II I I I M I II II I M I I II II I I I I II I III II I II I M I I II II I I I 

4 68 GCACCACCAAGAGTCGCCGAGCCTACGTCCGCATCGCCTACCTGCGCAAGAACTTCGATC 527 

503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I II II I II M II I II M I I I I I II II I II I I Mill I I I II II I 

528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

II I I II I II II I M M I I II II II II II II II II I I I II II II 

588 CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 647 

623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

M II II II II I I I II I I I I II II II I II II I I I II II II 

648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I II II M II I I II I M II II I I II I I I II II M II II I I I I II I M II 

7 08 T GT C GGAC ACT GC CAACT AT ACCT GCGT GGC CAAGAAC AT C GTGGCCAAAC GC C GGAGCA 767 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 
M I II II I I I I II M I I II II II II II I II I M I II I M I II II I 

7 68 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 8 62 

MM I I II II II I II I II I I II II II II I II II I I II I II II I I II I 
828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

8 63 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I M II I II I II II II Mill II II I Ml II II II I II II II II Ml 

8 88 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I II II I II I I II II I MM II II M II M II II II II II I I 

948 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 
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983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 
III I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 
1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

1043 AGT GC C AGGG CACT GACCT GGAC AC C C GCAACT GT AC CAGT GAC CT CT GT GTACAC AGT G 1102 

I I I I I I I I I I I II I I I I II II II I I I I III I 

1068 ACT GCAGCGGGAC GCT GCT CGACTCT AAGAACT GCACAGAT GGGCT GT GCAT GCAACT GG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I I I I I I III I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

III II II I I I I I I I I II I I I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1223 ATGTGGCTGACTCGTCCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1248 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 

1280 GCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 137 0 

II I I I I I I I II I I I I I I I I I I I I 

1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATCCCCATGA 1427 

1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I I I I I I I I I I I I II 
1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 14 87 

14 00 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I I I I 

14 88 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

14 48 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I I I I I I I I I I I I I I I II 

154 8 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 



1508 



1552 



TCCGCTC CCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCT 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 C AG AT G C CAT AC C C C GAG G G AAG AT C T AT GAG AT C T AC C T C AC G C T G C AC AAG C C G G AAG 1672 

I MINIMI I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1728 ATGGAG C CAT T C C C CAGGGCAAGT T CT AC GAGAT GT AT CT ACT C AT CAACAAGGC AGAAA 1787 

1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I II M II I I I I I I I I II I I I I I I I I I I I I I I 

1788 GTACCCTGCCGCTTTCAGAAGGGACCCAGACAGTATTGAGCCCCTCGGTGACCTGTGGAC 1847 

1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 



. Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I I I I I I I I I I 1 1 I I I I I I I 1 1 1 1 1 II I I 1 1 1 1 1 1 1 1 1 1 II II 

184 8 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1968 T G GT GAC C CT GGAT GAG GAGAC CCT GAAC ACAC C CT GCT ACT GC CAGCT GGAGC C C AGGG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

208 8 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

2033 AGT AC AAC AT C C G G GT CT AC T G C CT GC AT GAC AC C C AC GAT G C AC T C AAG GAG GT G GT G C 2 092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 
2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

2 093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

I 1 I I I I I I I I I I I I I I I I III I I I I I I I M I I I I I I I 

2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2153 AC AG T T AC C AC AAC C T G C GC CT AT C CAT C C AC GAT GT G C C C AG CTCCCTGTG GAAGAGT A 2212 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I 

2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 

2213 AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 2272 

I I I I II I II I I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I III I 
2328 AGCTGCTGGCCAAATACCAGGAGATCCCCTTCTATCACATTTGGAGTGGCAGCCAGAAGG 2387 

2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I II I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

238 8 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 24 47 

2333 AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 2392 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I III I I II I 

244 8 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 

2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2449 

III III II II I II I I I I 

2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

2450 CCCTGGTGGGCCCCAGTGCCTTCT^AGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2568 C C CAG CT GGGAC CTT ATGC CTT CAAGAT C C CACT GT CCAT CC GC CAGAAGAT AT GCAACA 2627 

2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

I II I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I I 

262 8 GC CT AGAT GC CC CCAACT C ACGG GGCAAT GACT GG C GGAT GT TAG C ACAGAAG CT CT CT A 2687 

2570 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 



Db 



2688 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 



Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II III I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

M I I I I I II I | I I I I I I I I I I I I 

Db 28 08 AGAT GGG CAAGAGT GAGAT GCTGGTGGCTGT GGC CAC C GAC GG GGACT GC T GA 2860 
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ABQ93898 standard; DNA; 2895 BP. 
ABQ93898; 
01-NOV-2002 (first entry) 

Human transmembrane receptor UNC5H2-like NOV11 DNA, SEQ ID NO: 37. 

Human; NOVX; neurological disorder; Alzheimer's disease; 
Huntington 1 s disease; Parkinson f s disease; pain; behavioural disorder; 
addiction; tuberous sclerosis; cancer; immune disorder; allergy; 
autoimmune disease; myasthenia gravis; asthma; arthritis; diabetes; 
thyroiditis; cardiovascular disease; hypertension; reproductive disorder; 
endometriosis; incontinence; psoriasis; scleroderma; alopecia; ulcer; 
pancreatitis; cirrhosis; glomerular endotheliosis ; bacterial infection; 
polycystic kidney disease; endocrine disorder; obesity; cardiomyopathy; 
atherosclerosis; cell signal processing-related disorder; 
metabolic pathway regulation disorder; cytostatic; neuroprotective; 
antiinflammatory; immunosuppressive; analgesic; antiatherosclerotic; 
dermatological; antibacterial; antiarthritic; hepatotropic; neurogenesis; 
differentiation; proliferation; motility; haematopoiesis ; wound healing; 
angiogenesis ; forensic biology; transgenic animal; drug screening; 
gene therapy; NOV11; transmembrane receptor UNC5H2-like; chromosome 10; 
gene; ds . 



Homo sapiens. 

Key 
5'UTR 

CDS 



sig__peptide 
mat_peptide 

3'UTR 

WO200253742-A2. 
ll-JUL-2002. 



Location/Qualifiers 

1. .30 

/*tag= a 

31. .2868 

/*tag= b 

/product^ "NOV11" 

31. .108 

/*tag= c 

109. .2865 

/*tag= d 

/product^ "Mature NOV11 protein" 
2869. .2895 
/*tag= e 
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PI Padigaru M, Taupier RJ, Miller CE, Eisen A; 

XX 

DR WPI; 2002-583619/62. 

DR P-PSDB; ABB09520. 
XX 

PT Novel polypeptides and nucleic acids homologous to transmembrane 

PT receptor, thymosin, neuromodulin-like family of proteins for diagnosing, 

PT treating cancer, atherosclerosis, neurological, skin and autoimmune 

PT disorders. 

XX 

PS Claim 9a; Page 121; 323pp; English. 
XX 

CC The invention relates to 24 novel human proteins designated NOV1-NOV14 

CC (ABB09501-ABB09524) , collectively referred to as NOVX proteins, and 

CC nucleic acids encoding them (ABQ93879-ABQ93902 ) . NOVX proteins and 

CC nucleotides are useful in the treatment, diagnosis or prevention of NOVX- 

CC associated disorders or in the manufacture of a medicament for treating 

CC such disorders, with specific applications described for each of the 24 

CC NOVX proteins, based on their homology to known proteins. Various 

CC disorders are associated with NOVX proteins including neurological 

CC disorders (e.g., Alzheimer's, Huntington's and Parkinson's diseases), 

CC pain, behavioural disorders, addiction, tuberous sclerosis, cancers 

CC (e.g., colorectal cancer, leukaemia and osteosarcoma), immune disorders 

CC (e.g., allergies and autoimmune diseases), myasthenia gravis, asthma, 

CC various forms of arthritis, diabetes, thyroiditis, cardiovascular disease 

CC (e.g., hypertension), reproductive disorders, endometriosis,. 

CC incontinence, psoriasis, scleroderma, alopecia, ulcers, pancreatitis, 

CC cirrhosis, glomerular endotheliosis , polycystic kidney disease, endocrine 

CC disorders, obesity, bacterial infections and particularly cardiomyopathy, 

CC atherosclerosis, cell signal processing-related disorders and disorders 

CC of metabolic pathway regulation. NOVX nucleic acids and polypeptides may 

CC be used to identify cellular receptors or downstream effectors which 

CC binds to a NOVX protein, and are also useful as targets for the 

CC identification of small molecules that modulate or inhibit processes such 

CC as neurogenesis, cell differentiation, cell motility, cellular 

CC proliferation, haematopoiesis, wound healing and angiogenesis . NOVX 

CC nucleic acid sequences can be used to identify a cell or tissue type and 

CC are useful as a source of primers or probes for forensic biology and for 



CC identifying and cloning NOVX homologues in other cell types. Cells 

CC comprising NOVX nucleic acids are useful for producing non-human 

CC transgenic animals which are useful for studying the function and 

CC activity of NOVX proteins and for identifying and evaluating modulators 

CC of NOVX activity. The present sequence represents DNA encoding the 

CC transmembrane receptor UNC5H2-like protein N0V11. The gene encoding N0V11 

CC is located on chromosome 10 

XX 

SQ Sequence 2895 BP; 557 A; 960 C; 854 G; 524 T; 0 U; 0 Other; 



Query Match 33.2%; Score 913.6; DB 6; Length 2895; 

Best Local Similarity 61.6%; Pred. No. 5.1e-167; 

Matches 1684; Conservative 0; Mismatches 919; Indels 129; Gaps 9; 

Qy 14 3 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

I I I I M II I M I II I 111 I I I I I I I I I I I I I I I I I | | 

Db 14 0 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 199 

Qy 203 T GT AC AT C GT CAAGAACAAG C CAGT GCT GCT T GT GT GCAAGGC C GT G C C C GC C AC G C AGA 262 

I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I II I I I I II I 

Db 200 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 259 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I M I I II II 
Db 260 T CT ACT T CAAGT GCAACGG C GAGT GG GT CAGC C AGAAC GACCAC GT CAC ACAGGAAG GC C 319 

Qy 323 CAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTT^ATGTCTCAAGGCAGCAGG 382 

I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 320 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 37 9 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 380 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 439 

Qy 443 GCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGC 502 

I I I I I I I I I M I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 440 GC ACCAC CAAGAGT C GC CGAGC C TAC GT C C GCAT CGC CT GT CT GCG CAAGAACT T C GAT C 499 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 500 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 559 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 560 CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 619 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 620 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 67 9 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 68 0 T GT C GGACAC T G C C AAC T AT AC CTGCGTGGC C AAGAAC AT C GT G G C C AAAC G C C G GAG C A 739 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 74 0 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 799 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 8 62 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I M | | | | | I I I I I I I I I I I 
800 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 859 

863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I M I I I I I I II II II I I I I I I I I II III I I I I I I I II I I I I I I I I I 

860 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 919 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I I I I I I 

920 CCAT CT GCC CAGT C GAT GGGGC GT GGACGGAGT GGAGCAAGT GGT CAGCCT GCAGCACT G 979 

983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

IN I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
980 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1039 

1043 AGT GC CAGGGCACT GACCT GGACAC CCGCAACT GT ACCAGT GACCT CT GT GTACACAGT G 1102 

I I I I M II I I I I I I I II I I I I I I I I I I I 

1040 ACT GCAGC GGGACGCT GCT CGACT CT AAGAACT GCACAGAT GGGCT GT GCAT GCAAAGTG 1099 

1103 CTTC TGGCCCTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I I I I I I 

1100 AGTCACAGTGTGGTCCTCCTGTCCCCGCAGTGCTGGAGGCCTCAGGGGATGCGGCGCTGT 1159 

1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I I I I I I I I I I I I I I II I I I I I IN || || I 

1160 ATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGGCAATCCTCATGGCGGTGGGGGTGG 1219 

1187 T C GT T TAT T GC C GGAAGAAGGAGGG GCT GGACT CAGAT GT GGCT GACT C GT C CAT T C 124 3 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

1220 TGGTGTACCGCCGCAACTGCCGTGACTTCGACACAGACATCACTGACTCATCTGCTGCCC 1279 

1244 TCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGC 1303 

IN I I I I I I I I I I I I I I I I I I I I I I I I I I 

1280 TGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGGCAAGGCCCAGTAACCCGCAGCTCC 1339 

1304 T CACCAT CCAGCCGGACCT CAGCACCACCAC CAC CACCTACCAGGGCAGT CT CT 1357 

I II II I I I I I I I I I I I I I I I I I II I I II II 

1340 TACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCGCCGGCATCTACCGCGGACCCGTGT 1399 

1358 GTCCCCGGCAGGA TG 1372 

I III I I I I I I 

1400 ATGCCCTGCAGGACTCCACCGACAAAATCCCCATGACCAACTCTCCTCTGCTGGACCCCT 1459 

1373 GGCCCAGCCCCAAGTTCCAGCTCACCA ATGGGCACCTGCTCAGCCCCCT 1421 

I I I I I M III II II II II I I I I I I I I I I I I 

1460 TACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCACCACGGGCTCTGGGCCAGGCCTGG 1519 

1422 GGGTGGCGGCCGCCACAC ACTGCACCACAGCTCTCCCACCTCTGAGGCCG 1471 

Ill III II I II I I I IN 

1520 CAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTGGCACATACCCTAGCGATTTCGCCC 1579 

1472 AGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTC CC 1516 

I I I I I I I I I I I I I I I I I I || 

1580 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTCGGTTCCCAGCAGCTCTTGGGCC 1639 



Qy 1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1640 TGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCTTTGGCTGCCTGGGTGGGAGGCTCA 1699 

Qy 1577 T GAT C C C T AAT AC AG G TAT C AG C C T C C T CAT C C C C C C AG AT G C CAT AC C C C GAG G G AAG A 1636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 17 00 GCATCCCCGGCACAGGTGTCAGCTTGCTGGTGCCCAATGGAGCCATTCCCCAGGGCAAGT 1759 

Qy 1637 TCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCT 1696 

I I I I I I I I I I I I I I I I I I I I I I I I II II II 

Db 17 60 T CT AC GAGAT GT AT CT AC T CAT CAAC AAG GC AGAAAGT ACCCT GC C GCTT T CAGAAGG GA 1819 

Qy 1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1820 CCCAGACAGTATTGAGCCCCTCGGTGACCTGTGGACCCACAGGCCTCCTGCTGTGCCGCC 1879 

Qy 1757 CAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCC 1816 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I 

Db 188 0 CCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCAGTGCCCGTGACTGGATCTTTCAGC 1939 

Qy 1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I 

Db 194 0 TCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGGTGGTGACCCTGGATGAGGAGACCC 1999 

Qy 1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2000 TGAACACACCCTGCTACTGCCAGCTGGAGCCCAGGGCCTGTCACATCCTGCTGGACCAGC 2 059 

Qy 1937 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1996 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2060 TGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCCGCTCAGCAGTCAAGCGGCTCCAGC 2119 

Qy 1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

II I II II II I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2120 TGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGGAGTACAGCCTCCGGGTCTACTGCC 2179 

Qy 2 057 T GCAT GACACCCACGATGCACT CAAGGAGGTGGTGCAGCTGGAGAAGCAGCT GGGGGGAC 2116 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2180 TGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGCGGACTCTGGGCGGAT 2239 

Qy 2117 AGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTAT 2176 

I III I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I 

Db 224 0 ACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGGACAGTTACCACAACCTGCGCCTCT 2299 

Qy 2177 C CAT C CAC GAT GT GC CCAGCTC CCT GT GGAAGAGT AAGCT CCT T GT CAGCTAC CAG GAGA 2236 

II i I I I II I I I I III I I 1 1 I I I 1 1 I I I I I I I I I I 1 1 I I I II I 

Db 2300 C C CT C CAT GAC CT CC C CCAT GC CCAT T GGAG GAGCAAGCT GCT GGC CAAATAC CAG GAGA 2359 

Qy 2237 TCCCCTTTTATCACATCTGG7^TGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2296 

I I I I I II I I I I I I I I I I II I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 2360 TCCCCTTCTATCACATTTGGAGTGGCAGCCAGAAGGCCCTCCACTGCACTTTCACCCTGG 2419 

Qy 2297 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2356 

III I I I I III I I I I I I I I I I II I I I I II I I I I I I I I I I 

Db 2420 AGAGG CAC AGC T T GGC CT C CACAGAGCT CACCT GCAAGAT CT G CGT GCGGCAAGT GGAAG 2479 

Qy 2357 GCGAC GGGCAGAGCTT CAGCAT CAACTT CAACATCACCAAG GACACAAGGTTTGCTG 2413 



Db 2480 GGGAGGGCCAGATATTCCAGCTGCATACCACTCTGGCAGAGACACCTGCTGGCTCCCTGG 2539 

Qy 2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2473 

I M I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2 54 0 ACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCACCCAGCTGGGACCTTATGCCTTCA 259 9 

Qy 2474 AGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGG 2533 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2600 AGAT CCCACT GTCCAT CCGCCAGAAGATAT GCAACAGCCTAGAT GCCCCCAACT CACGGG 2659 

Qy 2 534 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2593 

I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2660 GC AAT GAC T GGCGGAT GTT AG C ACAGAAGC T CT C TAT GGAC C GGT AC C T GAAT T ACTT T G 2719 

Qy 25 94 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2720 CCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACCTCTGGGAAGCTCTGCAGCAGGACG 2779 

Qy 2 654 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2713 

IN I I I I I I I I I I I I II III I I I I I I I I II 

Db 27 80 AT G GGGAC CT CAAC AGC CT G G CGAGT GC CT T GGAGGAGAT G GGCAAGAGT GAGAT GCT GG 2839 

Qy 2714 TCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 274 5 

I I I I I I I I I I I I I I I I 

Db 2 8 40 TGGCTGTGGCCACCGACGGGGACTGCTGAGCC 2871 



RESULT 15 
AAS21316 

ID AAS21316 standard; cDNA; 3884 BP. 
XX 

AC AAS21316; 
XX 

DT 24-OCT-2001 (first entry) 
XX 



DE Human cDNA sequence encoding for PR04 326 polypeptide. 
XX 

KW Human secretory and transmembrane; PRO; mammalian; cancer; lung; breast; 

KW prostate; cervical; tumour necrosis factor-alpha; TNF-alpha; cartilage; 

KW ear; proliferation; glucose; free fatty acid; skeletal muscle; adipocyte; 

KW A-peptide; factor VIIA; gene therapy; ss. 
XX 

OS Homo sapiens. 
XX 

PN WO200140466-A2. 
XX 

PD 07-JUN-2001. 
XX 

PF 01-DEC-2000; 2000WO-US032678 . 
XX 
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XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Beresini M, Deforge L, Desnoyers L, Filvaroff E, Gao W; 

PI Gerritsen ME, Goddard A, Godowski PJ, Gurney AL, Sherwood S; 

PI Smith V, Stewart TA, Tumas D, Watanabe CK, Wood WI, Zhang Z; 
XX 

DR WPI; 2001-408281/43. 

DR P-PSDB; AAU12244. 
XX 

PT Isolated , secretory and transmembrane PRO polypeptide used to detect 

PT other PRO polypeptides, link bioactive molecules to cells expressing PRO 

PT polypeptides, and detect the presence of mammalian tumors e.g. lung, 

PT breast, prostate, cervical. 
XX 

PS Claim 3; Fig 145; 813pp; English. 
XX 

CC AAS21244-AAS21518 encode for novel human secretory and transmembrane PRO 

CC polypeptides. The PRO polypeptides are useful to detect other PRO 

CC polypeptides, to link bioactive molecules to cells expressing PRO 

CC polypeptides, to modulate biological activities of cells expressing PRO 

CC polypeptides, and to detect the presence of mammalian lung, colon, 

CC breast, prostate, rectal, cervical or liver tumours by comparing PRO 

CC polypeptide expression in a cell sample to that in a control sample. Some 



CC of the 275 sequences are also useful to stimulate the release of tumour 

CC necrosis factor-alpha (TNF-alpha) from human blood, the proliferation or 

CC differentiation of chondrocytes, the proliferation or gene expression in 

CC pericyte cells, the release of proteoglycans from cartilage, the 

CC proliferation of inner ear utricular supporting cells or of T- 

CC lymphocytes, the release of a cytokine from peripheral blood monocytes 

CC (PBMCs), or the proliferation of endothelial cells. Some of the PRO 

CC polypeptides may modulate glucose or free fatty acid uptake by skeletal 

CC muscle cells or by adipocytes; or inhibit binding of A-peptide to factor 

CC VI IA. The PRO polypeptides can be used in assays to identify molecules 

CC involved in binding interactions. The polynucleotides encoding PRO 

CC polypeptides can be used to generate probes, antisense RNA/DNA, 

CC transgenic or knock out animals and can be used in gene therapy 

XX 

SQ Sequence 3884 BP; 767 A; 1278 C; 1162 G; 677 T; 0 U; 0 Other; 

Query Match 32.8%; Score 902.4; DB 4; Length 3884; 

Best Local Similarity 61.4%; Pred. No. 7.7e-165; 

Matches 1677; Conservative 0; Mismatches 926; Indels 129; Gaps 9; 

Qy 14 3 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 2 02 

III III II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 507 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 566 

Qy 2 03 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 2 62 

I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I I II I I I I 

Db 567 CCTACATTGTGAAG7VACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 626 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 627 T CT ACT T CAAGT GCAAC G GC GAGT GG GT CAGC C AGAAC GAC CACGT C ACAC AGGAAGGCC 686 

Qy 323 CAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGG 382 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 687 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 74 6 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I III II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 74 7 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 806 

Qy 44 3 GCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGC 502 

I I II II I I I I I I I I I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I 

Db 8 07 GC ACCAC CAAGAGT C GC C GAGC CTAC GT CCGC AT CGC CT AC CT GC GCAAGAACTT C GAT C 8 66 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
Db 8 67 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 926 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 92 7 CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 98 6 

Qy 62 3 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 

Db 987 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 1046 



Qy 



683 T T GCT GAC AC G GC CAACT ACAC CT GC GT GGC CAAGAACAT C GT GG C AC GTC GC C G CAGCG 742 



1047 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 1106 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I! I I I I I I I I I I I I I 
1107 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 1166 

803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1167 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 1226 

863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 
I M I II I I I I I II II I I I I I I I I I I M I I I I I I I I II MINI III 

1227 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 1286 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 
I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I 

1287 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1346 

983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 
III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1347 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1406 

104 3 AGT GC C AGG GC ACT GAC CT GGACAC C C GC AACT GT AC C AGT GAC C T CT GT GT AC AC AGT - 1101 

I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1407 ACTGCAGCGGGACGCT GCT CGACTCTAAGAACT GCACAGAT GGGCTGTGCAT GCAAAATA 1466 

1102 GCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I I I I I II I I I I I I I 
14 67 AGAAAACTCTAAGCGACCCCAACAGCCACCTGCTGGAGGCCTCAGGGGATGCGGCGCTGT 1526 

1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I I I I I I I I I I I I I I III I III III II II I 

1527 ATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGGCAATCCTCATGGCGGTGGGGGTGG 1586 

1187 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1243 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1587 TGGTGTACCGCCGCAACTGCCGTGACTTCGACACAGACATCACTGACTCATCTGCTGCCC 1646 

1244 TCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGC 1303 

III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

164 7 TGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGGCAAGGCCCAGCAACCCGCAGCTCC 1706 

1304 T CACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCT 1357 

I II II I I I I I I I I I I I I I I II I I I I I II II 

1707 TACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCGCCGGCATCTACCGCGGACCCGTGT 1766 

1358 GTCCCCGGCAGGA TG 1372 

I III I I I I II 

1767 AT GC CCT GCAGGACT C C AC C GACAAAAT C C CCAT GAC CAACT CT CCTCTGCTG GAC C C CT 1826 

137 3 GGCCCAGCCCCAAGTTCCAGCTCACCA ATGGGCACCTGCTCAGCCCCCT 1421 

I I I I I I I I I I I I I I I I II I I II I I I I II I I 

1827 TACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCACCACGGGCTCTGGGCCAGGCCTGG 1886 

1422 GGGTGGCGGCCGCCACAC AC T G C AC C AC AG C T C T C C C AC C T C T GAG G C C G 1471 

I I I I I I I I I II I I I I I I I I III 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1887 CAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTGGCACATACCCTAGCGATTTCGCCC 194 6 

1472 AGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTC CC 1516 

Ml I I I I I I I I I I I I I I I II 

1947 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTCGGTTCCCAGCAGCTCTTGGGCC 2006 

1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1576 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

2 007 TGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCTTTGGCTGCCTGGGTGGGAGGCTCA 2066 

1577 T GAT C C C T AAT AC AG GT AT C AG C C T C C T CAT C C C C C C AGAT G C CAT AC C C C GAG G G AAG A 1636 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2 067 GCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCAATGGAGCCATTCCCCAGGGCAAGT 2126 

1637 TCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCT 1696 

I M I I I I I I I I I I I I I I I I I I I I II II II 

2127 T CT ACGAGAT GTATCTACT CATCAACAAGGCAGAAAGT ACCCT CCCGCTTT CAGAAGGGA 2186 

1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2187 CCCAGACAGTATTGAGCCCCTCGGTGACCTGTGGACCCACAGGCCTCCTGCTGTGCCGCC 2246 



1816 



1757 CAGT C AT CCT G GCT AT G GAC CACT GT G GGGAGC C C AGC CCT GAC AGCT G GAG CCTGCGCC 
I I I I I I I I I I I I I I II I I I I I II III I I I I II I I I I 

2247 CCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCAGTGCCCGTGACTGGATCTTTCAGC 2306 

1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

M I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I 
2307 T C AAGACCC AG GC C CAC CAGGGCCACT GGGAGGAGGT GGT GAC C CT GGAT GAGGAGAC C C 2366 

1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2367 TGAACACACCCTGCTACTGCCAGCTGGAGCCCAGGGCCTGTCACATCCTGCTGGACCAGC 242 6 

1937 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1996 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
2427 TGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCCGCTCAGCAGTCAAGCGGCTCCAGC 2486 

1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

II I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2487 TGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGGAGTACAGCCTCCGGGTCTACTGCC 2546 

2 057 T GCAT GAC AC CC ACGAT GCACT CAAG GAGGTGGT GCAG CT GGAGAAGCAG C T GG G GGGAC 2116 

I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2547 TGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGCGGACTCTGGGCGGAT 2606 

2117 AGCT GAT C CAG GAGC CAC G GGT C CT G C ACT T C AAGGAC AGT T AC C AC AAC CT G C GC CT AT 2176 

I Ml I II I I I I II I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 

2607 ACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGGACAGTTACCACAACCTGCGCCTCT 2666 

2177 CCATCCACGATGTGCCCAGCT CCCTGTGGAAGAGTAAGCTCCTTGTCAGCTACCAGGAGA 2236 

I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2667 CCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCAAGCTGCTGGCCAAATACCAGGAGA 2726 

2237 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 22 96 

I I I I I I I I I. I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
2727 TCCCCTTCTATCACATTTGGAGTGGCAGCCAGAAGGCCCTCCACTGCACTTTCACCCTGG 27 8 6 



Qy 22 97 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2356 

III MM III I I I I M I I M M I I I II I I I I I I M I I I 

Db 2787 AGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCAAGATCTGCGTGCGGCAAGTGGAAG 2 84 6 

Qy 2357 GCGACGGGCAGAGCTT CAGCAT CAACTT CAACAT CACCAAG GACACAAGGTTTGCTG 2413 

I M II I I I I I I I II M | | || IM | 

Db 2847 GGGAGGGCCAGATATTCCAGCTGCATACCACTCTGGCAGAGACACCTGCTGGCTCCCTGG 2 906 

Qy 2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 2473 

I M I M II I I II I I II II II II I 1 I II I 

Db 2907 ACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCACCCAGCTGGGACCTTATGCCTTCA 2 966 

Qy 2474 AGAT C C C CT T C CT CATT C GG CAGAAGAT AAT T T C CAGC CT GGAC C C AC C CT GT AGGCGG G 2533 

II I I II I I I II II I I I I I I I I I I I I II I I I MM I I I I 

Db 2967 AGAT C C C ACT GT CC AT C C GC CAGAAGAT AT G CAACAG C CTAGAT GC C C C CAACT C ACGGG 3026 

Qy 2534 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2 593 

I I I II I II I I I I I I I I I II I II II I I I I I II I I II I I I 

Db 3027 GCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTATGGACCGGTACCTGAATTACTTTG 3086 

Qy 2594 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2653 

II MM I I I II I I I I I I II I II I I II I I M II I I I I I I I 

Db 3087 CCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACCTCTGGGAAGCTCTGCAGCAGGACG 314 6 

Qy 2654 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2 713 

III I I M I I I Mill I I III I II I I I I I II 

Db 3147 ATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGGAGATGGGCAAGAGTGAGATGCTGG 3206 

Qy 2714 TCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

I I I I I I II I II I II I I 

Db 3207 TGGCTGTGGCCACCGACGGGGACTGCTGAGCC 3238 
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1 : /cgn2_6/ptodata/2/ina/5A_COMB. seq: * 

2 : /cgn2___6/ptodata/2/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/2/ina/6A_COMB . seq: * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/2/ina/PCTUS_COMB.seq: * 

6: /cgn2_6/ptodata/2/ina/backfilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 



Result 
No. 


Score 


Query 
Match 


Length 


DB 


ID 








Description 


1 


2259 


82.1 


3014 


2 


US- 


08- 


808- 


982-1 


Sequence 


1, Appli 


2 


2259 


82.1 


3014 


3 


US- 


09- 


306- 


902A-1 


Sequence 


1, Appli 


3 


1562.4 


56. 8 


1787 


2 


US- 


08- 


808- 


982-2 


Sequence 


2, Appli 


4 


1562.4 


56. 8 


1787 


3 


us- 


09- 


306- 


902A-2 


Sequence 


2, Appli 


5 


1155. 8 


42.0 


1282 


4 


us- 


09- 


833- 


381-1806 


Sequence 


1806, Ap 


6 


841.4 


30. 6 


2831 


2 


us- 


08- 


808- 


982-3 


Sequence 


3, Appli 


7 


841.4 


30.6 


2831 


3 


us- 


09- 


306- 


902A-3 


Sequence 


3, Appli 


8 


432 


15.7 


1605 


4 


us- 


09- 


833- 


381-1807 


Sequence 


1807, Ap 


c 9 


269 


9.8 


771 


1 


us- 


08- 


253- 


155A-17 


Sequence 


17, Appl 


10 


119 


4.3 


305 


2 


us- 


08- 


808- 


982-4 


Sequence 


4, Appli 


11 


119 


4.3 


305 


3 


us- 


09- 


306- 


902A-4 


Sequence 


4 , Appli 





12 


53 


.6 


1. 


9 


657 


3 


us- 


-08- 


-985- 


-526-2 


Sequence 


2, Appli 




13 


53 


.6 


1. 


9 


1326 


3 


us- 


-08- 


-985- 


-526-4 


Sequence 


4, Appli 




14 


52 


.8 


1. 


9 


699 


4 


us- 


-09- 


-252- 


-991A-7947 


Sequence 


7947, Ap 




15 


52 


.8 


1. 


9 


1302 


4 


us- 


-09- 


-252- 


-991A-7809 


Sequence 


7809, Ap 


c 


16 


52 


.8 


1. 


9 


1947 


4 


us- 


-09- 


-252- 


-991A-7533 


Sequence 


7533, Ap 




17 


52 


.4 


1. 


9 


1770 


4 


us- 


-09- 


•252- 


-991A-12265 


Sequence 


12265, A 




18 


52 


.4 


1. 


9 


4884 


4 


us- 


09- 


-252- 


-991A-12126 


Sequence 


12126, A 


c 


19 


52 


.4 


1. 


9 


4884 


4 


us~ 


-09- 


-252- 


-991A-12292 


Sequence 


12292, A 




20 




52 


1. 


9 


7231 


4 


us- 


09- 


-919- 


172-64 


Sequence 


64, Appl 




21 


50 


.8 


1. 


8 


3885 


4 


us- 


09- 


-369- 


364A-16 


Sequence 


16, Appl 




22 


48 


.8 


1. 


8 


2493 


4 


us- 


09- 


-252- 


991A-11987 


Sequence 


11987, A 


c 


23 


48 


.8 


1. 


8 


2991 


4 


us- 


09- 


-252- 


991A-12025 


Sequence 


12025, A 


c 


24 


48 


. 6 


1. 


8 


1068 


4 


us- 


09- 


-252- 


991A-9933 


Sequence 


9933, Ap 




25 


48 


.6 


1. 


8 


1251 


4 


us- 


09- 


252- 


991A-10142 


Sequence 


10142, A 




26 


48 


.4 


1. 


8 


925 


3 


us- 


08- 


-858- 


003-1 


Sequence 


1, Appli 




27 


48 


.4 


1. 


8 


925 


3 


us- 


09- 


078- 


166-1 


Sequence 


1, Appli 




28 


48 


.4 


1. 


8 


925 


3 


us- 


08- 


-997- 


467-1 


Sequence 


1, Appli 




29 


48 


.2 


1. 


8 


1288 


1 


us- 


08- 


440- 


856A-9 


Sequence 


9, Appli 




30 


48 


.2 


1. 


8 


2034 


4 


us- 


09- 


252- 


991A-11958 


Sequence 


11958, A 


c 


31 




48 


1. 


7 


8312 


4 


us- 


09- 


620- 


312D-1048 


Sequence 


1048, Ap 




32 


47 


.8 


1. 


7 


2469 


4 


us- 


09- 


252- 


991A-5349 


Sequence 


5349, Ap 


c 


33 


47 


.8 


1. 


7 


5103 


4 


us- 


09- 


252- 


991A-5192 


Sequence 


5192, Ap 




34 


47 


. 8 


1. 


7 


6876 


4 


us- 


09- 


252- 


991A-5283 


Sequence 


5283, Ap 




35 


47 


.6 


1. 


7 


4257 


2 


us- 


08- 


690- 


473-1 


Sequence 


1, Appli 




36 


47 


.6 


1. 


7 


4257 


3 


us- 


09- 


259- 


821A-1 


Sequence 


1, Appli 




37 


47 


.6 


1. 


7 


4257 


3 


us- 


08- 


843- 


659-1 


Sequence 


1, Appli 




38 


47 


1. 


7 


7218 


1 


us- 


08- 


232- 


463-14 


Sequence 


14, Appl 




39 


46 


.2 


1. 


7 


1707 


4 


us- 


09- 


252- 


991A-10297 


Sequence 


10297, A 


c 


40 


46 


.2 


1. 


7 


2511 


4 


us- 


09- 


252- 


991A-10560 


Sequence 


10560, A 




41 


45 


.6 


1. 


7 


1627 


4 


us- 


09- 


675- 


018B-11 


Sequence 


11, Appl 




42 


45 


.2 


1. 


6 


987 


4 


us- 


09- 


252- 


991A-7285 


Sequence 


7285, Ap 




43 


45 


.2 


1. 


6 


1368 


4 


us- 


09- 


252- 


991A-7174 


Sequence 


7174, Ap 


c 


44 


45 


.2 


1. 


6 


1575 


4 


us- 


09- 


252- 


991A-7330 


Sequence 


7330, Ap 




45 


45 


1. 


6 


486 


4 


us- 


09- 


252- 


991A-8335 


Sequence 


8335, Ap 



ALIGNMENTS 



RESULT 1 
US-08-808-982-1 

Sequence 1, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tes sier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT: Hink, Lindsay 
APPLICANT : Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 



ZIP: 94104 
; . COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808,982 

FILING DATE: 
; CLASSIFICATION: 530 

ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
; TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 1: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 3014 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-808-982-1 

Query Match 82.1%; Score 2259; DB 2; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

I I M I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 
Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GACCTGCTTC CCCACTT CCT GGT GGAGCCCGAGGATGTGTACATCGT CAAGAACAAGCCA 225 

I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I 

Db 121 GAC C T G CT GC C CC ACTT C CT GGT AGAG C CT GAGGAC GT GT ACAT T GT CAAGAACAAGC C G 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

Ml II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 2 86 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I II I I I I I I II I I I I I II II I I I I II II III I I I I I I II I I I I 
Db 241 T GGGT C C GCC AGGT C GAT CAC GTAATT GAAC GC AGCAC C GACAGC AG C AGC GGAT T GC CA 300 

Qy 346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 

I I I I I I I I I I I I II II II II II I I I I I I II I I I I II I I I I I I I I I I I I I II I 
Db 301 ACCATGGAGGTCCGTATCAACGTATCGAGGCAGCAGGTAGAGAAAGTGTTTGGGCTGGAG 360 

Qy 4 06 GAATACT GGTGCCAGTGCGTGGCAT GGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGCC 465 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 



Qy 4 66 T ACAT C C GC ATAG C CAGAT T GC G C AAGAACT T C GAGCAG GAGC C G CT G GCCAAGGAGGT G 525 

I I I I I I I I II III I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I III 

Db 421 T AC AT C C G GAT T G C C TAT T T G C G C AAG AAC T T T GAG C AG GAG C C AC T G G C C AAG G AAGT G 4 80 

QY 52 6 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

M I I I I I I I I I I I I I II II II II II II II II II I M II I I I I I III 
Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

Qy 58 6 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I 
Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I M 
Db 601 AC G C G G GAG C AC AG C CT AGT C GT GC GT C AGGC CCGCCTGGCC GAC AC GGC C AACT AC AC C 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

M I I I I I I I I I I I I I II I I II I I I I I I I I III II I I II II Mill II II 
Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I M I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I III 
Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 94 5 

I I I M I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II III 
Db 841 T GT GAG GG G CAGAAT GT CCAGAAAAC AGC CT GC G CCACT CT GT GCC CAGT GGAT GG GAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I M I I I I I I I I II I I I I I I I I I I I I I II I I I I I 

Db 901 T G GAGT T C GT GGAGT AAGT G GT C AG C CT GT GGG CTT GACT GCAC CCACT G GC GGAG C C GC 960 

Qy 1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

I I I I I M I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I Ml I I I I I I I I I I I 
Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 108 0 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I M I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

Ml I I M M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 AC C T C AG G C T T C C AG C C C GT C AG CAT C AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C 1305 

I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 



Qy 1306 AC CAT C C AG C C G G AC C T C AG C AC C AC C AC C AC C AC C T AC C AG G G C AG TCTCTGTCCCCGG 1365 

M M M I I N I I I I I I I I I I I I I I I I I I II I I I II I I I I I Ill I II 

Db 12 61 AC CAT CCAGC C AGAC CT C AGC ACC AC CACTAC CAC CT AC CAG GGC AGT CTAT GTT C GAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I Ill I I I | | | I I I I I I I I I I I I I 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 142 6 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 14 8 6 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

Mill II I I M I I I I I I I I | | I I I I I I I I I I | M I I 

Db 1441 CGCCTCTCCACCCA7y^CTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 154 6 GG GAC CT T C AACT T CCTCGGGGGCCGGCT GAT GAT C C C T AAT ACAG GT AT C AGC CT C CT C 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I II I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 AT C C C C C C AGAT GC C AT AC C C C GAG GGAAGAT CTAT GAGAT CT AC C T CAC GCT GCAC AAG 1665 

II I I I M I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | 

Db 1561 AT ACC C C C GGAT G C CAT C C C CC GAGGAAAGAT C T AC GAGAT CT AC CT CACACT GCACAAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIM 
Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 168 0 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 17 85 

I I I I I I I I I I II I I I I I I I I I I II I II I I I I I I I I I I I I I I 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 17 40 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I II I I | | | | | | | | | | | | | | | | | | 
Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 19 65 

Ml I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I M I I I I I I I II I I I I I I I I I I III I I I I I I I I M I II I 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAG 2085 

I I I I I I I I I I II I I I I I I I II I I I I I I I I II I I I I I I I I I I | || I I I I I I I I I 
Db 1981 T C C C T T G AGT AC AAC AT C C G AGT GT AC T G C C T AC AC GAC AC C CAC GAC G C T C T C AAG GAG 2 04 0 

Qy 2 086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I M I I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I | | || | | | | M 

Db 2 041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

Qy 214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 



Db 



I I I I I Ml MINIMI I I | | M I I I I I I I II I I I I I I I I I II II II I I I 

2101 TTCAAAGACAGTTACCACAACCTACGTCTCTCCATCCACGACGTGCCCAGCTCCCTGTGG 2160 



Qy 2206 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 22 65 

Mill I I I I I I I I I I I M II I I I I I || | | | | | | Mill M I I II II I M I I I I I 
Db 2161 AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

Qy 22 66 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I I M I I I I M I I II I I I I I I M II I I I I M I I II I M I I II I I 

Db 2221 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCATCAACGCCAGCACCAGCGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I II II I I I II I II II II I I I I I I I I I I I M I I I M I I II I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 238 6 AACAT C AC CAAGGACACAAGGTT T GCT GAG CT GCTGGCT CT GGAGAGT GAAGC G G GG GT C 2445 

Ml M I I I I I M I M I I M I I I I I I I I M I I I I I I I I I I I I I I M I I I I I 

Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 24 00 

Qy 244 6 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I M II I I I II I I II I I I I I I II II I I I I I I I I M I I I I I II I II I M I I I I II I II 
Db 24 01 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I II I I I II I I I I I I II I I I I II I I II I I I I I I I I I II I I 
Db 2 4 61 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II II I I I I I I I II II I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I M II I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2 640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I I I I I I I I Mill I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 274 6 CGGCCAG 2752 

I II I I I 

Db 2701 CAGCCAG 2707 



RESULT 2 

US-09-306-902A-1 

; Sequence 1, Application US/09306902A 
; Patent No. 6277585 

GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 

NUMBER OF SEQUENCES: 9 
; CORRESPONDENCE ADDRESS: 



ADDRESSEE : SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 32 00 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/306, 902A 
; FILING DATE: 07-May-1999 

CLASSIFICATION: <Unknown> 
ATTORNEY/AGENT INFORMATION: 
; NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/DOCKET NUMBER: UC96-217 
; TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 1: 
; SEQUENCE CHARACTERISTICS: 

LENGTH: 3014 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-09-306-902A-1 

Query Match 82.1%; Score 2259; DB 3; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 

Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

QY 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CTGCTTCCC C AC TTCCTGGT GGAG C C C GAGGAT GT GT ACAT C GT C AAGAAC AAGC C A 225 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCTGCTGCCCCACTT CCT GGTAGAGCCT GAGGACGT GTACATT GT CAAGAACAAGC CG 180 

QY 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

QY 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I M I I I I I I I I I I II I I I I I || || I I I I II I I III I I I I I I II | | | | 
Db 241 TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 



Qy 



346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 



I I I I I I I I I I I I I I II II II II I II I I I I I I I I Mill Mill I I II I I I II 

Db 301 AC CAT G GAG GT C C GT AT C AAC GT AT C GAG G C AG C AG GT AG AGAAAGT GTTTGGGCTG GAG 360 

Qy 4 06 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 4 65 

I M I I I I I I I I M I I I I I I M I II II I II I I II II I I II I II I II I I I I I I I I I M I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 4 66 T AC AT C C G CAT AG C C AG AT T G C G C AAG AAC T T C GAG C AG GAG CCGCTGGC C AAG GAG GT G 52 5 

I M I I I I I II III I I II I II II I II I I I I II I I I I I II I I I I I II II I I III 

Db 421 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

M I I I I I II I Mill II II II II II II II II II II I M I II I I III 
Db 481 T CACT G GAGCAAGGCATT GTAC T AC CTTGTCGCCCCC CAGAAGGAAT CC C C C CAGCT GAG 54 0 

Qy 58 6 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

II I I I I II II I M II I I II II I I I I II II I I I I I II II II II I II I I I II II 

Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

II I I M M II I I I II I I II 1111111111111111 II II I I M II I I II II II I I 
Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 7 06 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 

M I I II I II I II I II I I I I II I II II II I III I I II II II I II I I II II 
Db 661 TGT GT G GC CAAGAACAT C GT AGC C C GT CGC C GAAGC ACCT CT G CAGC GGT CAT T GT T TAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

II I M II I II I II I II I II I II II I I I I II I I II M I I I I I I I I II II II II II I I II 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 82 6 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 8 85 

I M I I I II I II II I II I II I II II I I II II II II I I I I II I I I I M I II I I II I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 84 0 

Qy 886 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

II I I I II I I II II I II II I I I I II I I I I I II II I II I I II I I II I II I I II II III 

Db 841 T GT GAGGGG C AGAAT GT CCAGAAAAC AGC CT GC G C CACTCT GT G CC C AGT GGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

II I I I I M I I I I I I I I II I I I I II I I I I I I I I I II II I I II II I II I I I I I I I I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

M II I II I I II II I II I II I I II II I I II I I I I I II II I I III I II II I II I I I 
Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

M I I I M I II I I M II I I I II I I I I I I I I I I I I I II I II II I II II II I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

Mill I I I II I II I I I II II II II I II II I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 114 0 



Qy 118 6 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

II I MM II M I II I II I I I I II II I II II I I II I I II II II II II II I Ml 
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1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

AC CTCAGGCTT C CAGCCC GT C AGCATCAAGC CCAGCAAAGCAGACAACCCC CAT CT GCT C 1305 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I I I I 

ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | M | M 
AC CAT C C AG C C AGAC CT C AGC AC C AC C ACT AC C AC CT AC C AGGGC AGT CT AT GT T C GAG G 1320 

CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | Mill 
CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I 
AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 
I I I M I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I M I 
CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 
I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I II I I I I I II I I II I 
GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

AT CCCCCCAGAT GCCATAC C C CGAGGGAAGAT CTATGAGATCTACCTCACGCT GCACAAG 1665 
M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
ATACCCCCGGATGCCATCCCCCGAGGAAAGATCTACGAGATCTACCTCACACTGCACAAG 1620 

CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 
M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 168 0 

TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 17 85 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 18 00 

GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 
I I I I I I I I I I I I II I I I II I I I I II I II I I I I II I I I I I I I I I I II I I I I I I I II 
GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 
I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

T C C CT C GAGT AC AAC AT C C G G GT CT ACT G C CT GC AT GACAC C C AC GAT G C ACT C AAGGAG 2085 
I I I I I I I I I II I I I I I I I I II I I I I II I I II I I I I I I I I I I I II I I I I I I I I I 
T C CCT T GAGT ACAAC ATC C GAGT GT AC T GC CT ACAC GACACC CAC GACGCT CT CAAGGAG 204 0 



Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I II I I I i I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II II MINIMI 
Db 2041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

Qy 2146 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2101 T T C AAAGAC AGT T AC C AC AAC C T AC GT CT CT C CAT C C AC GAC GT G C C C AGCT C C CT GT GG 2160 

Qy 22 06 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 22 65 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGCAAGCT AC TT GT C AG CTAC CAG GAGATC C CT T TT T AC C AC AT CT GGAAC GGCACC 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I M III I I I I I I I I I I I I I I I I I I I I M I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCATCAACGCCAGCACCAGCGACCTG 228 0 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 234 0 

Qy 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 244 5 

I M I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2 506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I | | | | | | 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGC7\ACCTCGGCCAGCTGGCAGCAGCTGTG 264 0 

Qy 2 686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 2746 CGGCCAG 2752 

I I I I I I 

Db 27 01 CAGCCAG 27 07 



RESULT 3 
US-08-808-982-2 

; Sequence 2, Application US/08808982 
; Patent No. 5939271 
; GENERAL INFORMATION: 

; APPLICANT: Tessier-Lavigne, Marc 
; APPLICANT: Leonardo, E. David 



; APPLICANT: Hink, Lindsay 

APPLICANT: Masu, Masayuki, 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE : CALI FORNI A 

COUNTRY: USA 

ZIP: 94104 
; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808, 982 

FILING DATE: 
; CLASSIFICATION: 530 

ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/DOCKET NUMBER: UC96-217 
; TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
; INFORMATION FOR SEQ ID NO: 2: 
; SEQUENCE CHARACTERISTICS : 

LENGTH: 1787 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 
US-08-808-982-2 

Query Match 56.8%; Score 1562.4; DB 2; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 



Qy 1070 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I I I 1 I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 118 9 

M I I I I I I II I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1249 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | M I I 

Db 120 TT T ATT GC C G GAAGAAG GAGGGGCT GGACT CAGAT GT GGCT GACT CGT C C ATT CT C AC CT 17 9 

Qy 1250 C AG GCT T C C AGC C C GT C AG CAT C - AAG C C C AGCAAAG C AG ACAAC C C C CAT CT GCT CAC C 1308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 
Db 180 CAGGCTTCCAGCCCGTCAGCATCTAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 239 



Qy 

Db 



1309 AT C C AG C C GGAC CT CAGC AC C AC CAC CACCAC C T AC C AGG G CAGT CTCTGTCCCC G GCAG 1368 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 0 AT CC AGC C GGAC C T CAGCAC CACCAC CAC CAC CT ACCAG GGCAGT C T C T GT C C C C GGC AG 2 99 



Qy 13 69 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 
Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1429 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 148 8 

I I I I II I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I i I I I I I i I I I I I I I 

Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 14 89 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 154 8 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 0 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 47 9 

Qy 154 9 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 80 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 C C C C C AGAT GC C AT AC C C C GAGG GAAGAT CTAT GAGAT CT AC CT CAC G CT GC AC AAGC C G 1668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 540 C C C C C AGAT GC CAT AC C C C GAG GGAAGAT CTAT GAGAT CT AC CT CAC G CT GC ACAAG C C G 599 

Qy 1669 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1728 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 178 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 184 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 77 8 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CT C GAGT ACAACAT CCGGGT CTACT GC CT GCAT GACAC CCAC GAT GCACT CAAGGAGGT G 2088 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 958 CT C GAGT ACAACAT C C GGGT C TACT GC CT GCAT GACACC CAC GAT GCACT CAAGGAGGT G 1017 

Qy 2089 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 



Qy 



2149 AAGGAC AGT TAC C ACAACCT GC GCCT AT C CAT C CAC GAT GT GC C CAGCT C C CT GT GGAAG 2208 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1077 AAGGACAGTTACCACAACCT- 



III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

-GCCCTATCATCCACGATGTGCCCAGCTCCCTGTGGAAG 1134 



, Db 

Qy 2209 AGT AAGC T C CT T GT C AGC T AC C AG GAGAT C C C CT T T TAT C AC AT CT GGAAT GG CAC G C AG 2268 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I | M | | | | | | | | | | | | | | | | | | | | | | | M 
Db 1135 AGTAAGCT CCTTGT CAGCTACCAGGAGATCCCCT TTTAT CACAT CT GGAAT GGCACGCAG 1194 

Qy 22 69 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 

Db 1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

Qy 2 389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

Qy 244 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 35 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 

Qy 2 569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2628 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 95 CT G GACAG C CAT CT C AGCTT CT T T GC CT C CAAGC C C AG C C C CACAGC CAT GAT C CT CAAC 1554 

Qy 2 629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I I I I I II I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

Qy 2 747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 1680 



RESULT 4 

US-09-306-902A-2 

; Sequence 2, Application US/09306902A 
; Patent No. 6277585 

GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 

NUMBER OF SEQUENCES: 9 

CORRESPONDENCE ADDRESS : 



ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/306, 902A 

FILING DATE: 07-May-1999 

CLASSIFICATION: <Unknown> 
; ATTORNEY/AGENT INFORMATION: 

; NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415) 343-4341 

TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 1787 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
; SEQUENCE DESCRIPTION: SEQ ID NO: 2: 

US-09-306-902A-2 

Query Match 56.8%; Score 1562.4; DB 3; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 
Qy 1070 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I I I 1 1 1 1 1 I 1 1 i I I 1 1 1 I I I I I I I I I I I I 1 1 I 1 1 I I I I I I I I I I I I I l l l l l l l l l l l 

Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1249 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 0 T T TAT T GC C GGAAGAAGGAGGGGC T GGACT C AGAT GT G GCT GACT C GT C CAT T CT CAC CT 179 

Qy 1250 CAGGCTTCCAGCCCGTCAGCATC-AAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 1308 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 

Db 180 CAGGCTTCCAGCCCGTCAGCATCTAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 239 

Qy 1309 AT C C AGC C GGAC CT C AG CAC CAC CAC CAC CAC CT AC C AG G GC AGT CT C T GT C C C C GGCAG 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 0 ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 299 



Qy 



1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 



1428 



Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT.GGC 359 

Qy 1429 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 14 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I 
Db 360 GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

Qy 1489 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

Qy 154 9 AC CT T CAACT T CCTCGGGGGCCGGCT GAT GAT C C CT AAT ACAGGT AT CAGC CT C CT CAT C 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCG 1668 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 0 C C C C C AG AT G C CAT AC C C C GAG G GAAG AT C TAT GAG AT C T AC C T C AC G C T G C AC AAG C C G 599 

Qy 1669 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1728 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
Db 72 0 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 77 8 

Qy 184 9 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 
Db 779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

Qy 1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

Qy 1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 98 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

Qy 2029 CTCGAGTACAACATC CGGGTCTACTGCCT GCAT GACACC CAC GATGCACT CAAGGAGGTG 208 8 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 958 CT C GAGT AC AAC AT C C G GGT CT ACT G C CT G CAT GAC AC C CAC GAT G C ACT C AAG GAGGT G 1017 

Qy 208 9 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 2148 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1018 GT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CACGGGT CCT GCACTT - 1076 

Qy 214 9 AAGGACAGTT AC CACAACCT GCGCCT AT C CAT CCACGAT GTGC CCAGCTCCCT GT GGAAG 22 08 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1077 AAGGACAGT T AC CACAAC CT — G CC C TAT CAT C CAC GAT GT GC CCAGCT C CCT GT GGAAG 1134 

Qy 2209 AGT AAGCT C CTT GT C AGC T AC C AGGAGAT C C C CTT T TAT CAC AT CT G G AAT G G CAC G CAG 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1135 AGT AAGCT C CT T GT CAGCT AC C AGGAGAT C C C CT T T TAT CACAT CT GGAATG GCAC GCAG 1194 

Qy 22 69 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

Qy 2 329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1255 T GCAAGCT GT GGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAAC 1314 

Qy 2 389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 244 8 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

Qy 2 44 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

Qy 2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I II I I I I I I 
Db 1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 

Qy 2569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | I | 
Db 1495 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 1554 

Qy 2 629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 268 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

Qy 2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 274 6 

M I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

Qy 2747 GGCCAG 2752 

I I I I I I 

Db 1675 GGCCAG 1680 



RESULT 5 

US-09-833-381-1806 

; Sequence 1806, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
; FILE REFERENCE: 5800-119 

; CURRENT APPLICATION NUMBER: US/09/833,381 

; CURRENT FILING DATE: 2001-04-11 

; PRIOR APPLICATION NUMBER: 09/516,448 

; PRIOR FILING DATE: 2000-02-29 

; NUMBER OF SEQ ID NOS : 2050 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1806 

LENGTH: 1282 

TYPE: DNA 
; ORGANISM: Homo sapiens 



FEATURE : 

NAME/ KEY: misc_f eature 
LOCATION: (1) . . . (1282) 
OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-1806 

Query Match 42.0%; Score 1155.8; DB 4; Length 1282; 

Best Local Similarity 98.2%; Pred. No. 3e-240; 

Matches 1263; Conservative 0; Mismatches 13; Indels 10; Gaps 9; 

Qy 1469 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 1528 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 60 

Qy 1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1588 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 C CAGCAACAT GAC CT AT GGGAC CTT CAACT T CCTCGGGGGCCGGCT GAT GAT C C CT AAT A 120 

Qy 1589 C AG G T AT C AG C C T C C T CAT C C C C C C AG AT G C CAT AC C C C GAG G G AAG AT CT AT G AGAT C T 164 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 121 CAGGAATCAGCCTCCT CAT CCC CCCAGAT GCCATACCCCGAGGGAAGAT CTATGAGATCT 18 0 

Qy 164 9 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 17 08 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 24 0 

Qy 1709 TGAGTCCCATCGTTAGCTGTGGACCCCCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT- 1766 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGGCGTCCTGCTCACCCGGCCAGTCATCCTG 300 

Qy 1767 GGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCT-GGAGCCTGCGCCTCAAAAAGC 1825 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 301 GGGTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAGC 360 

Qy 1826 AGTCGTGCGAGGGCAGCTGGGAGGATGTGC-TGCACCTGGGCGAGGAGGCGCCCTCCCAC 1884 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AGTCGTGCGAGGGCAGCTGGGAGGATGTGCTTGCACCTGGGCGAGGAGGCGCCCTCCCAC 42 0 

Qy 1885 CTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGC 1944 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGC 480 

Qy 194 5 TTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTG 2004 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 
Db 481 TATGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTG 540 

Qy 2 005 TTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGAC 2064 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 541 TTTGCGCCGGTGGCCT GCAC CT C CCT C GAGT ACAAC ATACT GGT CT ACTGC CT G CAT GAC 600 

Qy 2065 ACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATC 2124 

II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 ACT CAC GAT G CACT CAACGT AGT GGT GC AGCT G GAGAAGCAGC T GG G GGGACAG CT GAT C 660 

Qy 2125 CAGGAGCCACGGGT CCT GCACTT CAAGGACAGTTAC CACAACCT GCGCCTAT C CAT CCAC 2184 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 661 CAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCAC 720 



Qy 

Db 



2185 
721 



2244 



780 



Qy 2245 TATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTC 2304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 TATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTC 840 

Qy 2305 AGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGG 2364 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGG 900 

Qy 2365 C AGAGCTT CAGCAT CAACT T CAACAT CAC CAAG GACACAAGGT TT G CT GAGCT GCT GGCT 2424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CAGAGCTTCAGCATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCT 960 

Qy 2425 CTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTC 2484 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
Db 9 61 CTGGAGAGTGAAGCGNGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTC 1020 

Qy 2485 CTCATTCGGCAGAAGATAA-TTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTG 254 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CTCATTCGGCAGAAGATAATTTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTG 108 0 

Qy 2544 GCGG-ACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGC 2602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCGGAACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGC 114 0 

Qy 2 603 C C AGC C C CAC AGC CAT GAT C C T C AAC CT GT G GGAGGC G C GGC ACT T C C C C AAC GGCAAC C 2662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
Db 1141 CCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACC 1200 

Qy 2 663 TCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAG 2722 

I 1 I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TCAGCCAGCTGG-TGCAGCAGTGGCTGGACTGGGC--AGCAGACGCTGG-CTCTTCACAG 1256 

Qy 2723 TGTCGGAGGCTGAGTGCTGAGGCCGG 274 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1257 TGTCGGAGGCTGAGTGCTGAGGCCGG 1282 
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ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
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Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I | | 

Db 104 ACTCCTTCCCATCAGCACCCGCGGAGCAGCTGCCTCACTTCCTGCTGGAACCAGAGGATG 163 

Qy 203 T GT AC AT CGT CAAGAACAAGC C AGT GCTGCTTGTGT GCAAGG C C GT G C C C GC C AC GC AGA 262 

I I I I I I I I I II I I I II I I I I I | | | | | | | | | | 

Db 164 C CT ACAT C GTAAAGAACAAGC C AGT GGAAT TGC AC T GC C GAGC CTT CCCT GC C ACACAGA 223 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

M I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 22 4 T CTACT T CAAGT GT AAT GG C GAGT GGGTT AGC C AGAAAGGCC ACGT CAC GCAGGAGAGC C 283 

Qy 323 CAGAC GGGAGCAGT GGGCT GC C CAC CAT G GAGGT C C GCAT TAAT GT CT CAAGGCAG C AGG 382 

I I I I M M Ml I I I I I I I II I I I I I I I I I I I I I I 

Db 284 T GGAT GAGGCCACAGGCTT GC GAAT AC GAGAGGTGCAGAT AGAGGTGT C GCGGCAGCAGG 343 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 4 42 

I Ml I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
Db 34 4 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 4 03 

Qy 44 3 GCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGC 502 

I I I II I I I I I I I II I I I I I I I I I I I I I I III I I I I I I I I I I I I I I II I 

Db 404 GAACCACCAAGAGTCGCCGAGCCTACATCCGCATTGCCTACTTGCGCAAGAACTTTGACC 463 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



503 



464 



563 



524 



623 



584 



683 



AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I MINIMI M I MM I M M M M 

AGGAGC CT CT G GC GAAGGAG GTAC C CT T GGAT CAT GAG GT C CTT C T GC AGT GC C GCC CAC 523 



CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 

I I M M MM M M M M M M M M M I I I M I I M M 

CAGAGGGAGT GCCT GTGGCT GAGGTGGAAT GGCT CAAGAAT GAAGAT GT CAT CGATCCCG 
CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 

I I M M I M I MM M M M M I I I M M M I M M 

CTCAGGACACTT^ACTTCCTGCTCACCATTGACCACAACCTCATCATCCGCCAGGCGCGCC 



T T G CT GACAC G G C CAACT AC AC CT GCGT GGC CAAGAACAT C GT GG CAC GT C G C C GCAG C G 

I I M M I I M M M M M M I M M I M M I M M M I M M I M I 

64 4 T CT CAGACAC AGCCAACT AC AC CT GT GT G G CAAAGAAT ATT GT GGC CAAG C GC C GGAGCA 



743 



704 



803 



CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 

I I M I M M M M M I M M M M M M M I I M I I M M I M 

CGACGGCCACAGTCATCGTCTATGTGAACGGAGGTTGGTCCAGCTGGGCAGAATGGTCAC 



622 



583 



682 



643 



742 



703 



802 



763 



862 



TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 

MM I MM M M M M M M M M I I Ml M M M M M M I 

7 64 CCTGCTCTAACCGCTGCGGCCGAGGTTGGCAGAAACGTACTAGGACCTGCACCAACCCAG 823 



863 



824 



923 



884 



983 



944 



CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I M M M i M M M M M I M M I M I I M M M M M M I M I 

CCCCACTCAATGGAGGTGCCTTCTGCGAGGGACAGGCTTGCCAGAAGACGGCTTGCACCA 8 83 

CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 
I I I M M M M I M M MM M M I M M M M M M M I I I 

CCGTGTGCCCAGTGGATGGAGCGTGGACTGAGTGGAGCAAGTGGTCCGCCTGCAGCACAG 94 3 

ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 
Ml M M M I I II I I II I I I I I I I II Mill I I I I I I II I 

AGTGTGCGCACTGGCGCAGCCGCGAGTGCATGGCACCGCCGCCCCAGAACGGAGGCCGTG 1003 



1043 AGT GC CAGGGCACT GAC CT GGACAC C C GCAAC T GT ACCAGT GACCT CT GT GT ACAC AGT G 1102 

II I I I II I II I I I I I II I I I II I II II I II II II 

1004 ACTGCAGCGGGACGCTACTTGACTCCAAGAACTGCACCGATGGGCTGTGCGTGCTGAATC 1063 

1103 CTTCTGGCC CTGAGGACGTGGCCCTCT 1129 

I I I I I I II I M II I 

1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I I II II I I II II I M I II I I I I III || M I I 

1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

1187 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1243 

M II I I I III M I I II II I I II I I I I II I I I 

1184 TCGTGTACCGGAGAAACTGCCGGGACTTCGACACGGACATCACTGACTCCTCTGCTGCCC 1243 

1244 T CACCT CAGGCTT C CAGC CCGT CAGCAT CAAGCC CAGCAAAGCAGACAACCCCCAT CT GC 1303 

I I I I I I M M I I M M II II I I II I I I I II M II II I I 

1244 TCACTGGTGGTTTCCACCCCGTCAACTTCAAGACTGCAAGGCCCAGCAACCCACAGCTCC 1303 



1304 T- 



- CAC CAT C C AG C C G GAC CT C AG CAC CAC CAC CAC CAC C T AC C AG G G C AGT C T CT 1357 



Db 



1304 



1363 



Qy 1358 GTCCCCGGCAGGA TG 1372 

I I I I I I I I I I 

Db 1364 ATGCCCTGCAGGACTCTGCCGACAAGATCCCTATGACTAATTCACCCCTTCTGGATCCCT 1423 

Qy 1373 GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCC CCTGG 1423 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1424 TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 1483 

Qy 1424 GTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCT 1483 

I I I I I I I III I I I I I I I I I I I I I I I 

Db 14 84 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 1543 

Qy 14 84 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 1516 

I I I M I I I I I I I I II 

Db 1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 1603 

Qy 1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 1663 

Qy 1577 T GAT CCCTAATACAGGT ATCAGCCTCCTCAT CCCCCCAGAT GCCATACC CCGAGGGAAGA 1636 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 1664 CCATTCCCGGCACAGGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGT 1723 

Qy 1637 T CT AT GAGAT CT AC C T CACGC T GC ACAAGCC GGAAGAC GT GAGGT T GC C CCT AGC T GGCT 1696 

I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1724 T CT AT GAC T T GT AT C T AC GT AT CAAC AAGAC T GAAAG C AC C CT C C CACT T T C GGAAG GT T 1783 

Qy 1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 17 84 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

Qy 17 57 CAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCC 1816 

III I I I I I I I I I I I I I I I I II II II I I I I I I I I I 

Db 18 44 CTGTTGTCCTCACTGTGCCCCACTGTGCTGAAGTCATTGCCGGAGACTGGATCTTCCAGC 1903 

Qy 1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

I I II I II I I II I I I I I I I I I I I I I I I I I III I I I I I I I I 

Db 1904 TCAAGACCCAGGCCCATCAGGGCCACTGGGAGGAGGTGGTGACTTTGGATGAGGAGACTC 1963 

Qy 1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 19 64 TGAACACCCCCTGCTACTGCCAGCTAGAGGCTAAATCCTGCCACATCCTGTTGGACCAGC 2023 

Qy 1937 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1996 

I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 

Qy 1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2084 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 

Qy 2057 T G CAT GAC AC C C AC GAT G C AC T C AAG GAG GT G GT G C AG C T G G AG AAG C AG CT G G G G G GAC 2116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2144 T GGAG GAC ACT C C T G CAGC ACT GAAGGAGGT C CT AGAG CT G GAGAG GAC TCTGGGTGGCT 2203 



Qy 2117 AGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTAT 2176 

I III I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2204 ACTTGGTGGAGGAGCCCAAGACTTTGCTCTTTAAGGACAGTTACCACAACCTACG-CTCT 2262 

Qy 2177 C CAT C C AC GAT GT G C C C AG CTCCCTGTG G AAG AGT AAG CTCCTTGT C AG C T AC C AG GAGA 2236 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2263 CCCTCCATGACATCCCCCATGCCCACTGGAGGAGCAAACTACTGGCCAAGTACCAGGAGA 2322 

Qy 2237 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2296 

I I I II I I I I I I I I I II I I I I III I I I I I I I I I I I I II I I I I I I I 

Db 2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 

Qy 2297 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2356 

III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2383 AGAGACATAGCCTAGCCTCCACTGAGTTCACCTGTAAGGTCTGCGTGCGGCAGGTAGAAG 24 42 

Qy 2357 GC GAC G GGC AGAG CT T CAG CAT CAACT T C AAC AT C AC CAAG GAC AC AAG GTTTGCTG 2413 

I II II MM III I I I II II II III I 

Db 2443 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 

Qy 2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 24 73 

I II I II I III I I I I I I I I I I I I II I I I I 

Db 2503 ATGCACTCTGCTCTGCCCCTGGCAATGCTGCCACCACACAGCTGGGACCCTATGCCTTCA 2562 

Qy 2474 AGATCCCCTTCCTCATTCGGCAGT^AGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGG 2533 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2563 AGAT ACCACT GT C CAT CCGCCAGAAGAT CT GCAACAGCCT GGACGC CCCCAACT CAC GGG 2622 

Qy 2534 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2593 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I 

Db 2623 GCAATGACTGGCGGCTGTTGGCACAGAAGCTCTCCATGGACCGGTACCTGAACTACTTCG 2682 

Qy 2594 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
Db 2 683 CCACCAAAGCTAGTCCCACAGGCGTGATCTTAGACCTCTGGGAAGCTCGGCAGCAGGATG 2742 

Qy 2 654 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2713 

III I I I I I I I I I I I I II II I I I I I I I I I II 

Db 2743 AT GGGGAC CT CAACAGCCT GGCCAGT GCCTT GGAGGAGAT GGGCAAGAGT GAGAT GCT GG 28 02 

Qy 2714 TCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I II I I I I I I I I I I I I 

Db 2803 T AGCCAT GAC CACT GAT GGC GAT T GCT GA 2831 
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; Patent No. 6277585 

; GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
; Leonardo,- E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 



TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 9 
CORRESPONDENCE ADDRESS: 
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REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2831 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
US-09-306-902A-3 

Query Match 30.6%; Score 841.4; DB 3; Length 2831; 

Best Local Similarity 60.0%; Pred. No. 2.4e-172; 

Matches 1638; Conservative 0; Mismatches 961; Indels 130; Gaps 9; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 2 02 

III III II I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I 

Db 104 AC T CC T T C C CAT CAGCAC C C GC GGAGCAG CT GC CT C ACT T CCT GCT GGAAC CAGAGGAT G 163 

Qy 203 T GT ACAT C GT CAAGAACAAGC C AGT GCT GCT T GT GT GCAAGGC C GT G C C C G C C AC GC AGA 262 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 164 CCTACATCGTAAAGAACAAGCCAGTGGAATTGCACTGCCGAGCCTTCCCTGCCACACAGA 223 

Qy 263 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 224 T CT ACT T CAAGT GT AAT G G C GAGT GG GTT AGC CAGAAAGGCCAC GT CAC GCAGGAGAG C C 283 

Qy 323 CAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGG 382 

I I I I M M III I I I I I I I II I I I I I MINIMI 

Db 284 T GGAT GAG GCCACAGGC T T G CGAAT ACGAGAG GT G CAGAT AGAGGT GT C G CG GCAGC AG G 343 



QY 



383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 
I III I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 



Db 344 TGGAGGAACTTTTTGGGCTCGAGGACTACTGGTGTCAGTGCGTGGCCTGGAGCTCTTCGG 4 03 

Qy 443 GCACCAC CAAGAGT CAGAAGGCCT ACAT CCGCAT AGC CAGATT GCGCAAGAACTT CGAGC 502 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 04 GAAC CAC CAAGAGT CG C C GAGCCT ACAT CC GCAT T GC CT AC TT GC GCAAGAACT T T G AC C 463 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
Db 464 AG GAGCCT CT GGC GAAGGAGGTAC C CT T GGAT CAT GAGGT C CTT CT GCAGT GCC GC C CAC 523 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 524 CAGAGGGAGT GCCTGT GGCTGAGGT GGAAT GGCT CAAGAAT GAAGAT GT CAT CGAT CC CG 583 

Qy 62 3 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I Mil I II I I I I I I I I I I I I I I I I I I I I ! I I I I I I 

Db 584 CT CAGGACACTAACTT C CT GC T CAC CAT T GAC CACAAC CT CAT CAT C C GC C AGG C GC GCC 643 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 644 T CT CAGACACAGC CAACT ACACCT GT GT GGCAAAGAAT AT T GT GGCCAAG C GC C GGAG CA 703 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 04 CGACGGCCACAGTCATCGTCTATGTGAACGGAGGTTGGTCCAGCTGGGCAGAATGGTCAC 763 

Qy 8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 

Db 764 CCTGCTCTAACCGCTGCGGCCGAGGTTGGCAGAAACGTACTAGGACCTGCACCAACCCAG 823 

Qy 863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 824 CCCCACTCAATGGAGGTGCCTTCTGCGAGGGACAGGCTTGCCAGAAGACGGCTTGCACCA 883 

Qy 923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 884 CCGTGTGCCCAGTGGATGGAGCGTGGACTGAGTGGAGCAAGTGGTCCGCCTGCAGCACAG 943 

Qy 983 ACT GCAC C C ACT GGC G GAGC C GT GAGT GCT C T GAC C C AG CAC C CC GC AAC G GAGG GGAGG 1042 

III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 944 AGT GT GCGCACT G GCGC AGC C GC GAGT GCAT GGC AC CGCCGCCC CAGAAC G GAGGC C GT G 1003 

Qy 1043 AGT GC C AGGGCACT GAC CT GGACAC C C GCAACT GT AC C AGT GAC CT CT GT GT AC AC AGT G 1102 

I I II I I I I I I II I I I I I I I I I I I II I I I I I I I II 

Db 1004 AC T GCAGC GG GAC GCT ACTT GACT CCAAGAACT GCAC CGAT GGGCT GT GC GT GCTGAAT C 1063 

Qy 1103 CTTCTGGCC CTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I I I I 

Db 1064 AGAGAACTCTAAACGACCCTAAAAGCCGCCCCCTGGAGCCGTCGGGAGACGTGGCGCTGT 1123 

Qy 1130 ATGTGGGCCTC ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCC 1186 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I 

Db 1124 ATGCGGGCCTCGTGGTGGCCGTCTTTGTGGTTCTGGCAGTTCTCATGGCTGTAGGAGTGA 1183 

Qy 1187 TCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT C 1243 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1184 TCGTGTACCGGAGAAACTGCCGGGACTTCGACACGGACATCACTGACTCCTCTGCTGCCC 124 3 
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12 4 4 T CAC C T CAGG CT T C CAG C C C GT CAG CAT CAAGC C C AGC AAAGCAGACAAC C C C CAT CT GC 1303 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1244 TCACTGGTGGTTTCCACCCCGTCAACTTCAAGACTGCAAGGCCCAGCAACCCACAGCTCC 1303 

1304 T CACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCT 1357 

I II II I I I I I I I I I III I I I I I I I I II III 

1304 TGCACCCATCCGCCCCTCCGGACCTAACGGCCAGTGCTGGCATCTACCGCGGACCTGTGT 1363 

1358 GTCCCCGGCAGGA TG 1372 

I III I I I I I I 

1364 ATGCCCTGCAGGACTCTGCCGACAAGATCCCTATGACTAATTCACCCCTTCTGGATCCCT 1423 

1373 GGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCC CCTGG 1423 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

1424 TGCCCAGCCTCAAGATCAAGGTCTATGACTCCAGCACCATCGGCTCTGGGGCTGGCCTGG 14 83 

1424 GTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCT 14 83 

I I I I I I I Ml I I I I I I I I I I I I I I I 

14 84 CTGATGGAGCCGACCTGCTGGGTGTCTTACCACCCGGTACATACCCAGGCGATTTCTCCC 1543 

14 84 CCCGCCTCTCCACCCAGAAC TACTTCCGCTCCC 1516 

I I I I I I I I Mill II 

1544 GGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCCTTGGTTCCCAGCACCTCCTGGGCC 1603 

1517 TGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGA 1576 

I M I II I I II I I I I I I I I I I I I I I I I II I I I I I M M II 

1604 TCCCTCGAGACCCCAGCAGCAGTGTCAGTGGCACCTTTGGTTGCCTGGGTGGGAGGCTGA 1663 

1577 TGAT CCCT AAT ACAGGTAT CAGCCT CCT CAT CCCC CCAGAT GCCATAC C CC GAGGGAAGA 1636 

MM I I I I I II I I I M I III I I I I II I II I I I I II 

1664 CCATTCCCGGCACAGGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGT 1723 

1637 T CT AT GAGAT C T AC C T CAC G CT GCAC AAGC C GGAAGAC GT GAGGT T GC C CCT AGCT GGCT 1696 

I I I I II I I I I II I I II II I I I I I I I M I 

1724 TCTATGACTTGTATCTACGTATCAACAAGACTGAAAGCACCCTCCCACTTTCGGAAGGTT 17 83 

1697 GTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGC 1756 
I I I I I I I M I I II I I I I I I II I I I I I I I I II I II II I I 

17 84 CCCAGACAGTATTGAGCCCCTCGGTGACCTGCGGGCCCACGGGCCTCCTCCTGTGCCGCC 1843 

1757 CAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCC 1816 

III I II I I I II I I I I II I I II II II I I II I I I I I 

18 44 CTGTTGTCCTCACTGTGCCCCACTGTGCTGAAGTCATTGCCGGAGACTGGATCTTCCAGC 1903 

1817 TCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGC 1876 

I I I I I II I I II I II II I I II II I II I I I III I I I I II I I 
1904 TCAAGACCCAGGCCCATCAGGGCCACT GGGAGGAGGTGGT GACTTT GGAT GAGGAGACT C 1963 

1877 CCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGC 1936 

I I I I I I II I I II II I I I I I I I I I II I II I I I I I I I II I I 

1964 TGAACACCCCCTGCTACTGCCAGCTAGAGGCTAAATCCTGCCACATCCTGTTGGACCAGC 2023 

1937 TGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGC 1996 

II II II I I I I I I I I I I I I I I I I II I I M I II I M 
2024 TGGGTACCTACGTGTTCACGGGCGAGTCCTACTCCCGCTCCGCAGTCAAGCGGCTCCAGC 2083 



Qy 1997 TGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCC 2056 

I I I I I I I I I I I I I I I I I I i I I II I I I I I I I I I I I I I I I I I 

Db 208 4 TAGCCATCTTCGCCCCAGCCCTCTGCACCTCCCTGGAGTATAGTCTCAGGGTCTACTGTC 2143 

Qy 2057 T GCAT GAC AC C CAC GAT GCAC T CAAGGAGGT G GT GC AG CT GGAGAAGC AGC T GGGGGGAC 2116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 4 TGGAGGACACTCCTGCAGCACTGAAGGAGGTCCTAGAGCTGGAGAGGACTCTGGGTGGCT 2203 

Qy 2117 AGCT GAT C C AG GAG C CAC G GGT C C T GCAC T T C AAG G AC AGT T AC C ACAAC C T G C GC CT AT 2176 

I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 04 ACTTGGTGGAGGAGCCCAAGACTTTGCTCTTTAAGGACAGTTACCACAACCTACG-CTCT 22 62 

Qy 2177 C CAT C CAC GAT GT GC C C AGCT C C CT GT G GAAGAGT AAGC T C CT T GT C AG CT AC C AGGAGA 2236 

I I I M I I I I I I I III I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2263 C CCT C CAT GAC AT C C CC CAT GC C CACT GGAGGAGCAAACT AC T GGC CAAGT AC CAGGAGA 2322 

Qy 2237 TCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGG 2296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 

Db 2323 TTCCCTTCTACCATGTGTGGAACGGCAGCCAGAAAGCCCTGCACTGCACTTTCACCCTGG 2382 

Qy 2297 AGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGG 2356 

Ml M I I I I I I I I I I I I I II I I I I I I 

Db 2383 AGAGACATAGCCTAGCCTCCACTGAGTTCACCTGTAAGGTCTGCGTGCGGCAGGTAGAAG 2442 

Qy 2357 GCGACGGGCAGAGCTT CAGCAT CAACTT CAACAT CAC CAAGGACACAAGGTTTGCTG 2413 

I I I I I I I I I I I I I I I I I II II III | 

Db 244 3 GGGAAGGCCAGATTTTCCAGCTGCACACCACGCTGGCTGAGACGCCTGCTGGCTCCCTGG 2502 

Qy 2414 AGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCA 24 73 

I M I II I III I I I I I I I I I I I I I I I I I I 

Db 2503 ATGCACTCTGCTCTGCCCCTGGCAATGCTGCCACCACACAGCTGGGACCCTATGCCTTCA 2562 

Qy 247 4 AGAT C C CCT T C CT CAT T C G GCAGAAGAT AATT T CC AGC CT GGAC C CAC C CT GTAG GC GGG 2533 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2563 AGATACCACTGTCCATCCGCCAGAAGATCTGCAACAGCCTGGACGCCCCCAACTCACGGG 2622 

Qy 2534 GTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTG 2593 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2623 G CAAT GACT GG C GGCT GT T GGCACAGAAGCT CT CC AT GGACC GGT AC CT GAAC T ACT T C G 2682 

Qy 2594 CCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCA 2 653 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2683 CCACCAAAGCT AGT CC CACAGGC GT GAT CT T AGAC CT CT G GGAAG CT C G GCAGCAG GAT G 2742 

Qy 2654 ACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCC 2713 

Ml I I I I II I I I I I I II Ml I II I I I I I II 

Db 2743 AT GGGGAC CT CAACAGCCT GGC CAGT GC CT T GGAG GAGAT GGGCAAGAGT GAGAT G C T G G 2 802 

Qy 2714 TCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I II I I I I I I I I I II I 

Db 2803 TAGCC AT GAC CACT GAT GGC GAT T G CT GA 2831 



RESULT 8 

US-09-833-381-1807 

; Sequence 1807, Application US/09833381 
; Patent No. 6672186 



GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 5800-119 

CURRENT APPLICATION NUMBER: US/ 09/ 833 , 38 1 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS : 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 1807 
LENGTH: 1605 
TYPE : DNA 

ORGANISM: Homo sapiens 
FEATURE: 

NAME/ KEY: misc_f eature 
LOCATION: (1) . . . (1605) 
OTHER INFORMATION: n - A,T,C or G 
US-09-833-381-1807 

Query Match 15.7%; Score 432; DB 4; Length 1605; 

Best Local Similarity 62.5%; Pred. No. 4e-84; 

Matches 737; Conservative 0; Mismatches 435; Indels 7; Gaps 4; 

Qy 1515 CCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCT 1574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I INI 

Db 421 CCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCTTTGGCTGCCTGGGTGGGAGGCT 48 0 

Qy 1575 GAT GAT C C C T AAT AC AG G TAT C AG C C T C C T CAT C C C C C C AG AT G C CAT AC C C C GAG G G AA 1634 

I I I I I I MM Ill III | | | MM 

Db 4 81 CANCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCAATGGAGCCATTCCCCAGGGCAA 54 0 

Qy 1635 GATCTATGA — GATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCT 1692 

I I I M II II I II I I I I I II II M 

Db 541 GT T CT AC GAAGAT GT AT T CT ACT CAT CAACAAGGCAGAAAGTAC CCTCCCGCTTT CAGAA 600 

Qy 1693 GGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACC 1752 

M M M I I I I I M I I I I II II I II M I I II I II M M I I 

Db 601 GGGACCCANACAGTATTGAGCCCCTCGGTGACCTGTGGACCCACAGGCCTCCTGCTGTGC 660 

Qy 1753 CGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTG 1812 

M I I I II I I M I I I II I II II I II II I I I I II I I I I I 

Db 661 CGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCAGTGCCCGTGACTGGATCTTT 720 

Qy 1813 CGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAG 1872 

I I I I I I I I I I I I I II II I M II I I I II I II II I II I II I II 
Db 721 CAGCT CAAGAC CC AGG C C C AC CAGGGC CACT GGGANGAGGT GGT GAC C CT GGAT GAGGAG 780 

Qy 1873 GCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAG 1932 

II I I I I I I I I II I II II I II II I M I I I II I II II I II 

Db 7 81 ACCCTGAACACACCCTGCTACTGCCAGCTGGAGCCCAGGGCCTGTCACATCCTGCTGGAC 840 

Qy 1933 CAGCTGGGCCGCT-TTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCT 1991 

I I I I M I M M I I II I I II II I I I I I I II I I I I I 

Db 841 CAGCTGGGCACCTACCGTGTTCACGGGCGAGTCCTATTCCCGCTCAGCAGTCAAGCGGCT 900 



Qy 



19 92 CAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTA 2 051 



Db 



901 



960 



Qy 2052 CTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGG 2111 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGCGGACTCTGGG 1020 

Qy 2112 G GGAC AGCT GAT C C AGGAG C C AC G GGT C CT GC ACT T CAAG GAC AGT T AC CAC AAC CT G C G 2171 

III I M I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 C G GAT AC T T G GT G GAG GAG C C G AAAC C G C T AAT G T T CAAG GAC AGT T AC CAC AAC C T G C G 1080 

Qy 2172 C CT AT C CAT C CAC GAT GT G C C C AG CT C C CT GT GGAAGAGT AAG CT C CT T GT C AGCTAC C A 2231 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCAAGCTGCTGGCCAAATACCA 1140 

Qy 2232 GGAGAT C C C CT T T TAT CAC AT CT G GAAT GGC AC GC AGC GGT AC T T GC ACT GC AC CTT CAC 2291 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I 
Db 1141 GGAGATCCCCTTCTATCACATTTGGAGTGGCAGCCAGAAGGCCCTCCACTGCACTTTCAC 1200 

Qy 22 92 CCTGGAGCGTGTCAGCCCCAG-CACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGG 2350 

I I I I I I I I III! I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1201 CCTGGAGAGGCACAGGCTTGGCCTCCACAGAGCTCACCTGCAAGATCTGCGTGCGGCAAG 12 60 

Qy 2351 T G GAGGGC GAC GGG C AGAGC TT C AGCAT CAACT T C AAC AT CAC CAAG GACACAAGGT 2407 

I I I I I I I I I I I I I I III I I M I I II | || 

Db 1261 T GGAAGGG GAGG GC CAGATAT T CC AGCT G CAT AC C ACT CT G GCAGAGAC AC CT GCT GGCT 1320 

Qy 24 08 TTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTG 2467 

M M I M I I I I I II I I I I I I I II 

Db 1321 CCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCACCCAGCTGGGACCTTATG 1380 

Qy 2468 CCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTA 2527 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CCTTCAAGATCCCACTGTCCATCCGCCAGAAGATATGCAACAGCCTAGATGCCCCCAACT 14 40 

Qy 252 8 GGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCT 2587 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1441 CACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTATGGACCGGTACCTGAATT 1500 

Qy 2588 TCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACT 2647 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1501 ACTTTGCCACCAAAGCGAGCCCCACGGNTGTGATCCTGGACCTCTGGGAAGCTCTGCAGC 1560 

Qy 264 8 TCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGG 2686 

I I I I I I I I I I I I I I I II Ml 

Db 1561 AGGAC GAT GGGGACCT CAACAG C CT GNC GAGT GCC T T G G 1599 



RESULT 9 

US-08-253-155A-17/C 

/Sequence 17, Application US/08253155A 
; Patent No. 5691147 

GENERAL INFORMATION: 
; APPLICANT: Gyuris, Jeno 
; APPLICANT: Draetta, Giulio 

TITLE OF INVENTION: CDK4 Binding Proteins 

NUMBER OF SEQUENCES: 95 



CORRESPONDENCE ADDRESS : 

ADDRESSEE: LAHIVE & COCKFIELD 

STREET: 60 State Street 

CITY: Boston 

STATE : MA 

COUNTRY: USA 
; ZIP: 02109 

COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 
; OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: ASCII (text) 
; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/08/253, 155A 

FILING DATE: 02-JUN-1994 
; CLASSIFICATION: 435 

; ATTORNEY/AGENT INFORMATION: 

; NAME: Vincent, Matthew P. 

; REGISTRATION NUMBER: 36,709 

; REFERENCE/ DOCKET NUMBER: MI I -02 8 

; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: (617) 227-7400 

; TELEFAX: (617) 227-5941 

; INFORMATION FOR SEQ ID NO: 17: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 771 base pairs 
; TYPE: nucleic acid 

; STRANDEDNESS: single 

; TOPOLOGY: linear 

MOLECULE TYPE: cDNA 
US-08-253-155A-17 

Query Match 9.8%; Score 269; DB 1; Length 771; 

Best Local Similarity 67.6%; Pred. No. 4.6e-49; 

Matches 406; Conservative 1; Mismatches 191; Indels 3; Gaps 2; 
Qy 1700 AGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAG 1759 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

738 AGACAGTATTGAGCCCCTCGGTGACCTGTGGACCCACAGGCCTCCTGCTGTGCCGCCCCG 67 9 



Qy 



1760 TCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCA 1819 



Db 



67 8 TCATCCTCACCATGCCCCACTGTGCCGAAGTCAGTGCCCGTGACTGGATCTTTCAGCTCA 619 



Qy 



Db 



182 0 AAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCT 1879 

II I I I I I I II II I I I I I I I I I I I I I I Mill I I I I I I I I 
618 AGACCCAGGCCCACCAGGGCCACTGGGAGGAGGTGGTGACCCTGGATGAGGAGACCCTGA 559 



Qy 



188 0 CCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGG 1939 




Db 



558 ACACACCCTGCTACTGCCAGCTGGAGCCCAGGGCCTGTCACATCCTGCTGGACCAGCTGG 499 



Qy 



Db 



194 0 GCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGC 1999 

II II I I I I I I I I I I I I I I I I I I I I I : I I I I I I I 

4 98 GCACCTACGTGTTCACGGGCGAGTCCTATTCCCGCTCAGCAGTCAAGCGGSTCCAGCTGG 439 



Qy 



2000 TTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGC 2059 



I II II II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II III 

Db 438 CCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGGAGTACAGACTCCGGGTCTACTGTCTGG 379 

Qy 2060 AT GACACCC ACGAT GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGC 2119 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 

Db 37 8 AGGACAGGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGCGGACTCTGGGCGGATACT 319 

Qy 212 0 T GAT C C AGGAG C CAC G GGT C CT GC ACT T C AAG GAC AGT T AC C AC AAC CT G C GC CT AT C C A 2179 

III M I II I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I 

Db 318 TGGTGGAGGAGCCGAAACCGCTAATGTTCAAGGACAGTTAACACAACCTGCG-CTCTTCC 260 

Qy 218 0 T CCACGAT GTGCCCAGCT CCCTGT GGAAGAGT AAGCT CCTT GTCAGCTAC CAGGAGAT C C 2239 

I I I I I I I I I I III I I II I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 259 TCCATGACCTCCCCCATGCCCATTGGAGGAGCAAGCTGCTGGCCAAATACCAGGAGATCC 200 

Qy 22 4 0 CCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGC 2299 

M I I I I I I I I I Ill I II I I I I I I I I I II II I I 

Db 199 C CTT C TAT CAC ATT T GGAGT GGAGC C AGAAGG — CCTCCACTGCACTTTCACCCTGGAGA 142 

Qy 2300 G 2300 

I 

Db 141 G 141 



RESULT 10 
US-08-808-982-4 

Sequence 4, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tes sier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE : SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808, 982 
FILING DATE: 
CLASSIFICATION: 530 
ATTORNEY/ AGENT INFORMATION: 
NAME: OSMAN, RICHARD A 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 



TELEPHONE: (415) 343-4341 
TELEFAX : (415) 343-4342 
INFORMATION FOR SEQ ID NO: 4: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 305 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-808-982-4 

Query Match 4.3%; Score 119; DB 2; Length 305; 

Best Local Similarity 68.1%; Pred. No. 7.8e-17; 

Matches 209; Conservative 0; Mismatches 95; Indels 3; Gaps 3; 

Qy 18 62 TGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACG 1921 

III I I I I I I I I I I II I I II II I I I I I I II I I I I I I I I I I I I I 

Db 1 T GGAT GAGGAGACCCTGAACACACC CT GCTACT G- CAGCTGGAGCCCAGGGCCT G- TACA 58 

Qy 1922 TCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCG 1981 

III I I I I I I I I I I I I I I I I II I I I I I I I It I 

Db 59 TCCTGCTGGACCAGCTGGGCACCTACGTTTTCACGGGCGAGTCCTATTCCCGCTCAGCAG 118 

Qy 1982 CCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACA 2041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 119 TCAAGCGGCTCCAGCTGGCCGT-TTCGCCCCCGCCCTCTGCACCTCCCTGGAGTACAGCC 177 

Qy 2042 TCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGA 2101 

I I I I I I I I I I I I II I I I I I I 1 I I I I I II I I I II I I I I I I II I I I I I I I I 

Db 17 8 TCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGC 237 

Qy 2102 AGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACC 2161 

I I I I I I I I I I III I I I I I I I II I I I I I I II I I I I I I I I 

Db 238 GGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGGACAGTTACC 297 

Qy 2162 ACAACCT 2168 

I I I I I I I 

Db 298 ACAACCT 304 



RESULT 11 
US-09-306-902A-4 

; Sequence 4, Application US/09306902A 

; Patent No. 6277585 

; GENERAL INFORMATION: 

; APPLICANT: Tessier-Lavigne, Marc 

; Leonardo, E. David 

; Hink, Lindsay 

; Masu, Masayuki 

; Kazuko, Keino-Masu 

TITLE OF INVENTION: Netrin Receptors 

NUMBER OF SEQUENCES: 9 
; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

; STREET: 268 BUSH STREET, SUITE 3200 

; CITY: SAN FRANCISCO 

STATE: CALIFORNIA 



COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 09/306, 902A 
FILING DATE: 07-May-1999 
CLASSIFICATION: <Unknown> 
ATTORNEY/AGENT INFORMATION: 
NAME: OSMAN, RICHARD A 
REGISTRATION NUMBER: 36,627 
REFERENCE/DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 4: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 305 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 4: 
US-09-306-902A-4 

Query Match 4.3%; Score 119; DB 3; Length 305; 

Best Local Similarity 68.1%; Pred. No. 7.8e-17; 

Matches 209; Conservative 0; Mismatches 95; Indels 3; Gaps 3; 

Qy 1862 TGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACG 1921 

III I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1 T GGAT GAGGAGAC C CT GAAC ACACC CT GCTACT G- CAGCT GGAGC C CAG G GCCT G- T ACA 58 

Qy 1922 TCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCG 1981 

III I I I I I I II I I I II I I I I I I I I I I I I I I I 

Db 59 TCCTGCTGGACCAGCTGGGCACCTACGTTTTCACGGGCGAGTCCTATTCCCGCTCAGCAG 118 

Qy 1982 CCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACA 2041 

I I I I I I III I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 

Db 119 TCAAGCGGCTCCAGCTGGCCGT-TTCGCCCCCGCCCTCTGCACCTCCCTGGAGTACAGCC 177 

Qy 2042 TCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGA 2101 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 17 8 TCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGGAGCTGGAGC 237 

Qy 2102 AGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACC 2161 

I I I I II I I I I III I I I I I I I II I I I I I I I I I I I I I I I I 

Db 238 GGACT CT GGG C GGAT ACT T GGT G GAG GAGC C GAAAC C GCT AAT GT T CAAGGACAGT T ACC 297 

Qy 2162 ACAACCT 2168 

I I I I I I I 

Db 298 ACAACCT 304 



RESULT 12 
US-08-985-526-2 

Sequence 2, Application US/08985526 
Patent No. 6080728 
GENERAL INFORMATION: 

APPLICANT: Mixson, James A 

TITLE OF INVENTION: CARRIER: DNA COMPLEXES CONTAINING DNA 
TITLE OF INVENTION: ENCODING ANT I -ANGIOGENIC PEPTIDES AND THEIR USE IN 
GENE 

TITLE OF INVENTION: THERAPY 
NUMBER OF SEQUENCES: 43 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Connolly, Bove, Lodge, & Hutz 
STREET: 1220 Market Street, P.O. Box 2207 
CITY: Wilmington 
STATE: Delaware 
COUNTRY: U.S.A. 
ZIP: 19899 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/985,526 
FILING DATE: 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/608,845 
FILING DATE: 16-JUL-1996 
ATTORNEY/AGENT INFORMATION: 

NAME: McMorrow Jr., Robert G 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 658-9141 
TELEFAX: (302) 658-5613 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 657 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
US-08-985-526-2 

Query Match 1.9%; Score 53.6; DB 3; Length 657; 

Best Local Similarity 52.7%; Pred. No. 0.012; 

Matches 116; Conservative 0; Mismatches 104; Indels 0; Gaps 0; 

Qy 756 CATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAG 815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 222 CAGCGACTCTGCGGACGATGGCTGGTCTCCATGGTCCGAGTGGACCTCCTGTTCTACGAG 281 

Qy 816 CTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGG 875 

I I I I I I II I I I I I I I I I I MM III I I 

Db 282 CTGTGGCAATGGAATTCAGCAGCGCGGCCGCTCCTGCGATAGCCTCAACAACCGATGTGA 341 

Qy 876 GGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGT 935 

I II I I I II III I I I I I I I I I I I I 



Db 342 GGGCT CCT C GGT C C AGACAC GGAC CT GC CACAT T CAGGAGT GT GACAAAAGAT T TAAACA 4 01 



Qy 936 AGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGT 975 

I I I I I I I I II I II I II I I I I I I I MM 
Db 4 02 GGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGT 441 



RESULT 13 
US-08-985-526-4 

Sequence 4, Application US/08985526 
Patent No. 6080728 
GENERAL INFORMATION: 

APPLICANT: Mixson, James A 

TITLE OF INVENTION: CARRIER: DNA COMPLEXES CONTAINING DNA 

TITLE OF INVENTION: ENCODING ANT I -ANGIOGENIC PEPTIDES AND THEIR USE IN 
GENE 

TITLE OF INVENTION: THERAPY 
NUMBER OF SEQUENCES: 43 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Connolly, Bove, Lodge, & Hutz 
STREET: 1220 Market Street, P.O. Box 2207 
CITY: Wilmington 
STATE: Delaware 
COUNTRY: U.S.A. 
ZIP: 19899 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/985, 526 
FILING DATE: 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/608,845 
FILING DATE: 16-JUL-1996 
ATTORNEY/AGENT INFORMATION: 

NAME: McMorrow Jr., Robert G 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 658-9141 
TELEFAX: (302) 658-5613 
INFORMATION FOR SEQ ID NO: 4: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1326 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
US-08-985-526-4 

Query Match 1.9%; Score 53.6; DB 3; Length 1326; 

Best Local Similarity 52.7%; Pred. No. 0.015; 

Matches 116; Conservative 0; Mismatches 104; Indels 0; Gaps 0; 

Qy 7 56 CATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAG 815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III 
Db 222 CAGCGACTCTGCGGACGATGGCTGGTCTCCATGGTCCGAGTGGACCTCCTGTTCTACGAG 281 



Qy 816 CTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGG 875 

I II I I I II I I I I I I I I I I I I I I III I I 

Db 282 CTGTGGCAATGGAATTCAGCAGCGCGGCCGCTCCTGCGATAGCCTCAACAACCGATGTGA 341 

Qy 876 GGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGT 935 

I I I I I I II III I I I I I I I I I I I I 

Db 342 G GGCT C CT C GGT C C AGACAC GGACCT GC CACATT C AGGAGT GT GACAAAAGAT T TAAAC A 401 

Qy 936 AGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGT 975 

I I I I I I I I I I I I I III I I I I I I! I III 
Db 402 GGATGGTGGCTGGAGCCACTGGTCCCCGTGGTCATCTTGT 441 



RESULT 14 

US-09-252-991A-7947 

; Sequence 7947, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252, 991A 

CURRENT FILING DATE: 1999-02-18 
; PRIOR APPLICATION NUMBER: US 60/074,788 

PRIOR FILING DATE: 1998-02-18 
; PRIOR APPLICATION NUMBER: US 60/094,190 
; PRIOR FILING DATE: 1998-07-27 
; NUMBER OF SEQ ID NOS : 33142 
; SEQ ID NO 7947 

LENGTH: 699 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-7947 



Query Match 1.9%; Score 52.8; DB 4 ; Length 699; 

Best Local Similarity 47.6%; Pred. No. 0.019; 

Matches 156; Conservative 0; Mismatches 172; Indels 0; Gaps 0; 

Qy 1824 GCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCA 18 83 

III I I I I I I I I I I I I I I I I I I I I I III II 

Db 160 GCCGAAGTACGACGTCTACGACAGCAACGAGGTGCTCGAGGCCAAGCTGCTGTCCGGGCA 219 

Qy 1884 CCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCG 1943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 220 TTCCGGCTACGACCTGGTGGTGCCCAGCGACAGCTTCCTGCCCAACTACCTGAAGGCCGA 279 



Qy 1944 CTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCT 2003 

I I I I I II II III I I I I I I I I I I I I II 

Db 28 0 GGTGTTCCAGCCGCTGGACAAGAGCAAGCTGCCGAACTGGAAGAACCTCAACCCGGCCCT 339 

Qy 2004 GTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGA 2063 

II I I I I I I I I I I I I I II I I II I I I I I I 

Db 34 0 GCTCAAGGTGCTCGCCGGCAAGGACCCCGGCAACCGCTACGTGATGCCCTACATGTGGGG 399 



Qy 2064 CAC C CAC GAT GC ACT CAAG GAGGT GGT GCAG CT G GAGAAGCAG CT GGGGGGAC AGCT GAT 2123 

I I M I I I I I I I I III I Ml M I I I 

Db 4 00 CACCAACGGCATCGCCTACAACCTCGACAAGGTCCGCGCGGTGCTCGGCGACGATGCGCC 459 

Qy 2124 CCAGGAGCCACGGGTCCTGCACTTCAAG 2151 

MM I I I I I I II MINI 

Db 460 GCTGGACTCCTGGGACCTGGTGTTCAAG 487 



RESULT 15 

US-09-252-991A-7809 

; Sequence 7809, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/ 09/252 , 991A 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

PRIOR FILING DATE: 1998-02-18 
; PRIOR APPLICATION NUMBER: US 60/094,190 
; PRIOR FILING DATE: 1998-07-27 
; NUMBER OF SEQ ID NOS : 33142 
; SEQ ID NO 7809 

LENGTH: 1302 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-2 52-991A-7809 

Query Match 1-9%; Score 52.8; DB 4; Length 1302; 

.Best Local Similarity 47.6%; Pred. No. 0.022; 

Matches 156; Conservative 0; Mismatches 172; Indels 0; Gaps 0; 



Qy 1824 GCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCA 1883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 360 GCCGAAGTACGACGTCTACGACAGCAACGAGGTGCTCGAGGCCAAGCTGCTGTCCGGGCA 419 

Qy 1884 CCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCG 1943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 42 0 TTCCGGCTACGACCTGGTGGTGCCCAGCGACAGCTTCCTGCCCAACTACCTGAAGGCCGA 47 9 

Qy 1944 CTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCT 2003 

I I I I I II II III I I I I I I I I I I I I II 

Db 480 GGTGTTCCAGCCGCTGGACAAGAGCAAGCTGCCGAACTGGAAGAACCTCAACCCGGCCCT 539 

Qy 2004 GTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGA 2063 

II I I I III III I I I I II I I II I I I I I I 

Db 540 GCTCAAGGTGCTCGCCGGCAAGGACCCCGGCAACCGCTACGTGATGCCCTACATGTGGGG 599 

Qy 2064 CACC CACGAT GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT 2123 

I I I I II I I I I I I III I I I I I I I I I 

Db 600 CACCAACGGCATCGCCTACAACCTCGACAAGGTCCGCGCGGTGCTCGGCGACGATGCGCC 659 



Qy 



2124 CCAGGAGCCACGGGTCCTGCACTTCAAG 2151 



Db 660 GCTGGACTCCTGGGACCTGGTGTTCAAG 687 

Search completed: July 7, 2004, 16:24:16 
Job time : 190 sees 



GenCore version 5.1. .6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



July 7, 2004, 11:17:27 ; Search time 1154 Seconds 

(without alignments) 
11504.523 Million cell updates/s 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 3163042 seqs, 2412103800 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
US-09-918-779-1 

; Sequence 1, Application US/09918779 
; Publication No. US20030064369A1 
; GENERAL INFORMATION: 



APPLICANT: Taupier, Raymond 
APPLICANT: Padigaru, Muralidhara 
APPLICANT: Rastelli, Luca 
APPLICANT: Spaderna, Steven 
APPLICANT: Shimkets, Richard 
APPLICANT: Zerhusen, Bryan 
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APPLICANT: Stone, David 
APPLICANT: Smithson, Glennda 

TITLE OF INVENTION: Novel Proteins and Nucleic Acids Encoding Same 
FILE REFERENCE: 21402-074 US 
CURRENT APPLICATION NUMBER: US/09/918,779 
CURRENT FILING DATE: 2001-07-30 
PRIOR APPLICATION NUMBER: 60/221,409 
PRIOR FILING DATE: 2000-07-28 
PRIOR APPLICATION NUMBER: 60/222,840 
PRIOR FILING DATE: 2000-08-04 
PRIOR APPLICATION NUMBER: 60/223,752 
PRIOR FILING DATE: 2000-08-08 
PRIOR APPLICATION NUMBER: 60/223,762 
PRIOR FILING DATE: 2000-08-08 
PRIOR APPLICATION NUMBER: 60/223,770 
PRIOR FILING DATE: 2000-08-08 
PRIOR APPLICATION NUMBER: 60/223,769 
PRIOR FILING DATE: 2000-08-08 
PRIOR APPLICATION NUMBER: 60/225,146 
PRIOR FILING DATE: 2000-08-14 
PRIOR APPLICATION NUMBER: 60/225,392 
PRIOR FILING DATE: 2000-08-15 
PRIOR APPLICATION NUMBER: 60/225,470 
PRIOR FILING DATE: 2000-08-15 
PRIOR APPLICATION NUMBER: 60/225,697 
PRIOR FILING DATE: 2000-08-16 
PRIOR APPLICATION NUMBER: 60/263,662 
PRIOR FILING DATE: 2001-02-01 
PRIOR APPLICATION NUMBER: 60/281,645 
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NUMBER OF SEQ ID NOS : 61 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 1 
LENGTH: 2752 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-918-779-1 

Query Match 100.0%; Score 2752; DB 13; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 



Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

QY 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

QY 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | M I I I I I 
Db 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

Qy 181 T T C CT G GT GGAGCC CGAGGAT GT GT ACAT C GT CAAGAACAAGC CAGT GCT GCT T GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | II | | | | | | 
Db 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 240 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
Db 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

Qy 301 GACCACGT GAT C GAGC GCAGCACAGAC GGGAGC AGT GG GCT GC C C AC CAT G GAGGT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 3 01 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

Qy 361 AT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT ACTGGTGCCAG 42 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 420 

Qy 421 T G C GT GG C AT GGAGCT C CT C GG GCAC CACCAAGAGT CAGAAGGC CTACAT CC GCAT AGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

Qy 4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

Qy 601 AAC GAG G AC C T G GT G G AC CCGTCCCTG G AC C C C AAT GT AT AC AT C AC G C G G GAG C AC AG C 660 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AACGAGGACCTGGT GGAC CCGT CCCT GGACCC CAAT GTATACAT CACGCGGGAGCACAGC 660 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 72 0 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 78 0 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 84 0 



Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

I I I I I 1 1 I 1 1 1 1 1 1 1 I 1 1 1 1 I I I I 1 1 1 i I I 1 1 1 1 I I I I 1 1 1 1 I I I I I 1 1 1 I 1 1 I 1 1 1 i 1 1 

Db 901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I 
Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

Qy 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 108 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
Db 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 108 0 

Qy 1081 AGT GAC C T CT GT GT AC AC AGT GCTTCTGGCCCT GAG GAC GT G G C C CT CT AT GTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 114 0 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAG 12 60 

Qy 1261 C C C GT C AGC AT CAAGC C C AGC AAAGCAGACAAC C C C CAT C T GCT C AC CAT C CAG C C GGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 C C C GT C AGC AT CAAGC C C AGC AAAGCAGACAAC C C C CAT CT GCT C AC CAT C C AGC C GGAC 1320 

Qy 1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

Qy 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 14 4 0 

Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

Qy 1621 AT AC C C C GAG GGAAGAT CT AT GAGAT C T AC CT CAC GC T G C AC AAGC C GGAAGACGT GAGG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AT AC C C C GAG GGAAGAT CT AT GAGAT CT AC CT CAC GC T GCACAAGC C GGAAGAC GT GAGG 168 0 



Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I 1 I I I I I- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 18 00 

Qy 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I II I I I I 1 1 1 1 1 1 1 1 I I I 1 1 I I 1 1 1 1 1 I i 1 1 1 I I I I I I I 1 1 1 I I I I I 1 1 1 1 I 1 1 1 1 1 l 

Db "1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 AT C CG GGT C TACT GC CT GCAT GACAC CC AC GAT GC ACT CAAGGAGGT GGT GC AGCT G GAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I I I I I I I I M I I I I I 
Db 2041 AT C CGG GT CTACT GC CT GCAT GACAC C CAC GAT GCACT CAAGGAG GT GGT GC AGCT GGAG 2100 

Qy 2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCACGGGT CCT GCACTT CAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! 

Db 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

Qy 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 22 80 

Qy 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 
Db 22 81 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

Qy 2341 GTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAAGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GT GT GGCAG GT G GAGGG C GAC G GGCAGAG CTT C AGC AT CAACT T CAACAT CAC CAAGGAC 2400 

Qy 2 401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

Qy 2461 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 C C C AGT GC CT T C AAGAT CCCCTTCCT CAT T C G G C AGAAGAT AAT T T C C AGC CT GGAC C CA 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 



I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I ! I I I I I I I I I II I I I I I 

Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 25 81 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 27 01 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 
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Query Match 100.0%; Score 2752; DB 17; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 12 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 18 0 

I I I I I I I I 1 1 I I I i I I I I I I I I 1 1 I 1 1 I 1 1 I I I I I I I I I I I I 1 1 I I I 1 1 1 1 1 I 1 1 1 I I I I 

Db 121 C AGC AGAGT G C C AC C GT GG C C AAC C C AGT G C CT G GT GC C AAC C C GGACCT GCT T C C C C AC 18 0 

Qy 181 T T CCT GGT GGAGC CC GAGGAT GT GT AC AT CGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 24 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 181 TT CCT GGT GGAGC CCGAGGAT GT GT AC AT CGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 24 0 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

Qy 301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GAC CAC GT GAT C GAGC G CAGC AC AGAC G GGAGC AGT GGGCTGCC C AC CAT GGAGGT C C GC 360 

Qy 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I 

Db 361 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 420 

Qy 421 T G C GT GGCAT GG AG CT C CT C G G GCAC C ACCAAGAGT C AG AAGGC C T ACAT C C GC AT AG C C 480 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 421 T GC GT GGCAT GGAGC T C CT C G G GCAC C ACCAAGAGT C AGAAGGC CT ACAT CC GCATAG C C 480 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 



Qy 



541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 



600 



I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

Qy 601 AAC GAGGAC CT GGT G GAC C C GT C C CT GGAC C C CAAT GT AT AC AT CACGCGGGAGCACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AAC GAGGAC C T GGT G GAC C C GT C C CT GGAC C C CAAT GT AT AC AT CAC G C GG G AGCACAGC 660 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 01 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 102 0 

Qy 1021 GCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGTACC 1080 

I I I 1 1 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 i 1 1 I I I 1 1 1 I I 1 1 1 I I I I I 1 1 1 1 

Db 1021 GC AC C C C GCAAC GGAGGGGAG GAGT GC C AGG G CACT GAC CT GGAC ACCCGCAACT GT ACC 1080 

Qy 10 81 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 114 0 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 12 01 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT CCATT CTCACCT CAGGCTT C CAG 1260 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CATT CTCACCT CAGGCTT CCAG 1260 

Qy 12 61 C C C GT CAGC AT C AAG C C CAG C AAAGC AGAC AAC C C C CAT CT GCT CAC CAT C CAG C C G GAC 1320 

I I I I I 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 1 1 1 I 1 1 i I I 1 1 1 I I I I I I 1 1 I 1 1 1 1 1 I I 1 1 1 1 1 I I I 1 1 1 I 

Db 1261 C C C GT CAG CAT C AAG C C CAG C AAAG CAG AC AAC C C C CAT C T G C T CAC CAT C CAG C C G GAC 1320 

Qy 1321 CT CAGC AC CAC CAC CAC CAC CT AC C AG GG C AGT CT CT GT C C C C GGCAG GAT GG GC C CAG C 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

Qy 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 



1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

1501 7\ACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 

1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

1621 AT AC C C C GAG GGAAG AT CT AT GAGAT CT AC CT C AC GCT G CACAAGC C GGAAGAC GT GAGG 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 AT AC C C C GAGGGAAGAT CT AT GAGAT CT AC CT C AC GCT G C AC AAGC C GGAAGAC GT GAG G 1680 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 18 00 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 18 60 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

192 1 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 198 0 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 AAGCAGCT GGGG GGACAG CT GAT C C AGGAGC C ACG G GT C CT GC ACT T CAAGGACAGT TAC 2160 

2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCAC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

2221 GT CAGCTACCAGGAGATCC CCTTTTATCACAT CTGGAAT GGCACGCAGCGGT ACTT GCAC 22 8 0 



Qy 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I > M I I I I I I I I I I I I I I M I 

Db 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

Qy 2341 GT GT GGC AGGT GGAGG G C GAC GG G C AG AGCT T C AGC AT CAACT T C AAC AT CAC CAAG GAC 2400 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 
Db 2341 GT GT GGCAGGTGGAGGGC GAC GGGCAGAGCTT CAGCAT CAACTTCAACATCACCAAGGAC 2400 

Qy 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

Qy 24 61 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2 64 0 

Qy 2 641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 27 01 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 



RESULT 3 
US-09-970-944-1 

; Sequence 1, Application US/09970944 

; Publication No. US20030204052A1 

; GENERAL INFORMATION: 

; APPLICANT: Herrman, John L 

; APPLICANT: Rastelli, Luca 

; APPLICANT: Shimkets, Richard A 

TITLE OF INVENTION: No. US20030204052Alel Proteins and Nucleic Acids Encoding 
Same and 

TITLE OF INVENTION: Antibodies Directed Against these Proteins 
; FILE REFERENCE: 21402-138 

; CURRENT APPLICATION NUMBER: US/09/970, 944 

; CURRENT FILING DATE: 2002-05-02 

; PRIOR APPLICATION NUMBER: 60/237,862 

; PRIOR FILING DATE: 2000-10-04 

; NUMBER OF SEQ ID NOS : 62 

; SOFTWARE: Patent In Ver. 2.1 

; SEQ ID NO 1 

LENGTH: 2881 
; TYPE: DNA 

; ORGANISM: Homo sapiens 
US-09-970-944-1 



Query Match 97.3%; Score 2676.4; DB 11; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2728; Conservative 0; Mismatches 21; Indels 9; Gaps 



Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TT C CT GGT GGAGC C CGAGGAT GT GT AC AT C GT CAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 82 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

I I I II I I I I II I I I II I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I 

Db 342 GAC CAC GT GAT CGAGC G CAG CACAGAC GGGAGCAGT GGT GAGC C GAC CAT G GAG GT C C GC 401 

Qy 361 ATT AAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCT GGAGGAATACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 402 AT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT T CGGGCTGGAGGAAT ACT GGT GC CAG 4 61 

Qy 421 T GC GT GGCAT GGAG CT C CT C GG GC AC CAC C AAGAGT C AGAAGGC CT ACAT C C GC AT AGC C 480 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 4 62 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 521 

Qy 4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AAC GAGGAC CT GGT GGACC C GT C CCT GGAC C C CAAT GT AT AC AT CAC G C GG GAGC AC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 642 AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 



Qy 

Db 



721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 62 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 

822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



840 



881 



900 



941 



957 



901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I I I I I I I I I I I I I t II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 C CAG CAC C CC G CAAC GGAGGGGAG GAGT GC CAGGGCACT GAC CT GGACAC C C GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1122 AC C AGT GACCT CT GT GT ACACAGT GCT T CT GGCC CTGAGGAC GT GGC C CT CT AT GT GGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CATT CT C ACCT CAGGCT T C 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1242 C GGAAGAAGGAGG G GCT GGACT CAGAT GT GGCT GACT C GT C CATT CT CAC CT CAG GCT T C 1301 

1258 C AGC C C GT CAG CAT C AAGC C C AGC AAAGCAGAC AAC C C C CAT CT GCT CAC CAT C C AGC C G 1317 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1302 C AGC C C GT C AGCAT CAAG C C CAG CAAAG C AGACAAC C C C CAT CT GCT CAC CAT C C AGC C G 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GACCT CAG CAC CAC CAC CAC CTAC C AG GGCAGT C T CT GT C C CCGG CAGGAT GGG C CC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 147 8 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 CAGAACTACTT CC GCT CCCT GCCC CGAGGCACCAGCAACAT GACCT AT GGGACCTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GCC AT AC C C C GAG G GAAGAT CT AT GAGAT CTAC CT CAC GCT GC AC AAGC C GGAAGAC GT G 1677 



Db 1659 G C CAT AC C C C G AGG GAAGAT C TAT GAG AT CT AC C T C AC G C T G C AC AAG C C G GAAGAC GT G 1718 

Qy 1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 17 97 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 177 9 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

Qy 1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 18 54 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1839 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGCAGGATGTG 18 98 

Qy 1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

Qy 1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I | | | M 
Db 1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

Qy 1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2035 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAG 2 0 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 07 9 TACAACAT C CGG GT C T ACT GCCT GC ATGACAC C CAC GAT GCACT CAAG GAGGT G GT GCAG 2138 

Qy 2 095 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2139 CT G GAGAAG C AGCTGGGGG GACAGC T GAT C CAGGAGC CAC GGGTCCT GCACT T CAAG GAC 2198 

Qy 2155 AGTTACCACAAC CTGCGCCTAT CCAT CCACGAT GTGCCCAGCT CCCTGT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2199 AGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAG 2258 

Qy 2215 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2259 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2318 

Qy 2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CTGTGGGTGTGG C AGGT G GAGGGC GAC GG G C AGAG C T T C AGC AT CAACT T CAAC AT CAC C 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 



Qy 



2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



24 99 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 



Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2 575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | | 
Db 2619 AGC CAT CT C AGCT T CT T T GC CT C CAAGC C CAGC C GCACAGC CAT GAT C CT CAAC CT GT G G 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 67 9 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 

RESULT 4 

US-10-311-623-13 

Sequence 13, Application US/10311623 
Publication No. US20040023244A1 
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APPLICANT: HAFALIA, April J. A.; BAUGHN, Mariah R. 
APPLICANT: BANDMAN, Olga; ARVIZU, Chandra S. 
APPLICANT: YANG, Junming; XU, Yuming 
APPLICANT: GANDHI, Ameena R. ; WARREN, Bridget A. 
APPLICANT: DING, Li; SANJANWALA, Madhusudan M. 
APPLICANT: DUGGAN, Brendan M. ; LU, Yan 
TITLE OF INVENTION: RECEPTORS 
FILE REFERENCE: PF-07 93 USN 

CURRENT APPLICATION NUMBER: US/10/311,623 
CURRENT FILING DATE: 2002-12-17 
PRIOR APPLICATION NUMBER: US 01/19942 
PRIOR FILING DATE: 2001-06-21 
PRIOR APPLICATION NUMBER: US 60/214,027 
PRIOR FILING DATE: 2000-06-21 
PRIOR APPLICATION NUMBER: US 60/228,045 
PRIOR FILING DATE: 2000-08-25 
PRIOR APPLICATION NUMBER: US 60/255,104 
PRIOR FILING DATE: 2000-12-12 
NUMBER OF SEQ ID NOS : 24 
SOFTWARE: PERL Program 
SEQ ID NO 13 
LENGTH: 3580 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc feature 



; OTHER INFORMATION: Incyte ID No. US20040023244A1 6052371CB1 
US-10-311-623-13 

Query Match 85.6%; Score 2356; DB 17; Length 3580; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2537; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 4 3 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | 

Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C C GGAC CTGCTTCCC C ACT T C CT GGT G GAGC C C GAGGAT GT GTACAT C GT CAAGAAC AAG 222 

I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
Db 121 C C G G AC CTGCTTCCC C AC TTCCTGGTG GAG C C C GAG GAT GT GTACAT C GT CAAGAAC AAG 18 0 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 24 0 

Qy 283 GAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTG 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAGT GGGT G C GCCAGGT GGAC C ACGT GAT C GAG C GCAGC AC AGAC G G GAGC AGT GGG CT G 300 

Qy 34 3 CCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTG 402 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 301 CCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTG 360 

Qy 4 03 GAGGAAT ACT GGT GC C AGT GC GT G GCAT GGAG CT C CTCGG G C ACCAC CAAGAGT CAGAAG 4 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGGAAT ACT GGTGCCAGTGCGT GGCAT GGAGCT CCTCGGGCACCAC CAAGAGT CAGAAG 420 

Qy 463 GCCTACATCCGCATAGCCAGATTGCGCAAG7\ACTTCGAGCAGGAGCCGCTGGCCAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I II I II I I I I I I I I I I II I I I I I I I I I I 
Db 421 GCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 480 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 54 0 

Qy 583 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 642 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATAC 600 

Qy 64 3 AT C AC GC G GGAG C AC AGC C T GGT GGT GC GAC AG GCCCGCCTTGCT GAC AC G G C C AACT AC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 762 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 720 



QY 



763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 
I I I I I I 



Db 



721 TACGTG 



726 



Qy 823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

Db 727 726 

Qy 883 TTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGC 942 

Db 727 GACGGC 732 

Qy 943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 10 02 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 

Db 733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

Qy 1003 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 1062 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 
Db 793 CGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTG 852 

Qy 1063 GACACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTG 1122 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 853 GACAC C CGCAACT GT AC CAGT GAC CT CT GT GT AC ACACT GCT T CT GGCC CT GAGGAC GT G 912 

Qy 1123 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 972 

Qy 1183 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 973 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1032 

Qy 1243 CT C AC CT CAG GCT T C C AGC C C GT C AGC AT CAAGC C CAGC AAAGCAGACAAC C C C CAT CT G 1302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1033 C T C AC C T CAG G C T T C CAG C C C GT CAG CAT C AAG C C CAG C AAAG C AGAC AAC C C C CAT C T G 1092 

Qy 1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1152 

Qy 1363 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1422 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1153 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1212 

Qy 1423 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 14 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1213 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1272 

Qy 1483 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1273 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1332 

Qy 1543 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I MINIMI 
Db 1333 TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTC 1392 

Qy 1603 CTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCAC 1662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1393 CT CAT C C C C C CAGAT G C CAT AC CC C GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCAC 1452 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1663 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1722 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1453 AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 1512 

1723 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1782 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I i 
1513 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1572 

1783 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1842 

I I 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1573 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1632 

1843 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1633 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1692 

1903 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1693 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1752 



1963 



2022 



GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I II I I I I I I I I I I I I I I M 
1753 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 1812 

2 023 AC C T C C C T C GAGT AC AAC AT C C G G GT C T AC T G C C T G CAT G AC AC C C AC GAT G C AC T C AAG 2 082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1813 ACCT C CCT CGAGTACAACAT C C GGGTCT ACTGC CTGCAT GACAC CCACGAT GCACT CAAG 1872 

2083 GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 2142 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1873 GAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTG 1932 

2143 CACTTC7VAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 22 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1933 CACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTG 1992 

2203 T G G AAGAGT AAG CTCCTTGT C AG C T AC C AG GAG AT C C C C T T T TAT C AC AT C T G G AAT G G C 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1993 T GGAAGAGT AAG CT C CT T GT CAGCTAC CAGGAGAT C C C CT T T TAT CAC AT CT GGAAT GGC 2052 

2263 ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2053 AC G C AG C G GT AC T T G CAC T G CAC C T T CAC C C T G GAG C GT GT C AG C C C C AG CAC T AGT G AC 2112 

2323 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I 

2113 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2172 

2383 TTCAACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGG 2442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 

2173 T T CAACAT CAC CAAG GACAC AAG GTT T GCT GAGCT GCT GGCT CT GGAGAGT GAAG C GGG G 2232 

2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

2233 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2292 



Qy 

Db 



2503 
2293 



ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 
I I II II I I I I I I I I I I I I I I I I I I I I I I || I I I I i I I I I I I I I I I I I I i II I I I I I I I I I 
ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 



2562 
2352 



Qy 



2563 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2622 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2353 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2412 



Db 



Db 




Db 



Qy 



2 683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2473 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 



Qy 



2743 GGCCGGCCAG 2752 



Db 



2533 GGCCGGCCAG 2542 
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Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II M I I I I I I I I I I I I I I I I I I I I I I I MINIM II II II II II I I I II II M 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CTGCTTCCC CACT T CCT GGT GGAGC C C GAGGAT GT GT AC AT C GT C AAG AACAAGC C A 225 

II I II I I I I I M M II II I II I II M I Mill II II II M II II I I II II I I II 

Db 121 GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 18 0 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I II II I I II I I I I II I I Ml I II II I I I II I I II Mill 

Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 28 6 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

Mill I I II I I I Ill II II II I II I I I III I II I I I M II II 

Db 241 T GG GT C C GC C AG GT CGAT CAC GT AAT T GAAC GC AGC AC C GACAGCAGCAG C GGAT TGC CA 300 

Qy 34 6 AC CAT G GAGGT C C GCAT T AAT GT CT CAAG GCAGC AGGT CGAGAAGGT GTT C GGG CT GGAG 405 

II M M M I I I I M II II II II II I I II I I II I II II I II II I II I II I II I 

Db 301 AC CAT GGAGGT CC GT AT CAAC GT AT C GAGGCAGC AGGTAGAGAAAGT GTT T GG GCT G GAG 360 

Qy 4 06 GAATACT GGT GCCAGTGCGTGGCATGGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGCC 465 

M I M II II I II I I II I I II I I M I I II II I I I I I I I I I I II I II II I I II I 

Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 4 66 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 52 5 

I M I II II II III I M II I II I I I I I I I I I I I II I II I II I II I II I I I II I 
Db 421 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

M M I I II I I Mill II II II II II II II II II Mill II I I I III 
Db 481 T CACT G GAGCAAG GCAT T GT ACT ACCTT GT C GC C C CC CAGAAGGAAT C CC C C CAG CT GAG 54 0 

Qy 586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I II I II I I I I I II II I M II I II I I I I I I II Mill II II I I II M I II I II 
Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 



Db 



601 



660 



Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 7 65 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I Ml I I I I II II I I I I I II II 
Db 661 TGTGTGGC C AAGAAC AT C GT AG CCCGTCGCC GAAG C AC C T C T GC AG C GGT C ATT GT T TAT 72 0 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 82 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I IN 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 84 0 

Qy 886 T GT GAG GGGC AGAAT GT C C AG AAAACAGC C T G C GC C AC C CT GT G C C C AGT AGAC G GC AGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 900 

Qy 94 6 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GACCCAGCACCCC GCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
Db 961 GAGT GCT CT GAC CCAGCAC C C C GCAAT G GAGGT GAGGAGT GT CGG GGT GCT GAC CT GGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 
Db 1261 ACCATCCAGCCAGACCTCAGCACCACCACTACCACCTACCAGGGCAGTCTATGTTCGAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 14 86 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I | | | | || | | I M I I I I I I I 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 15 60 

Qy 1606 AT C C C C C C AGAT GC C AT AC C C C GAGG GAAGAT C TAT GAG AT C T AC CT C AC GC T GC AC AAG 1665 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I II 
Db 1561 ATACCCCCGGATGCCAT CCCCCGAGGAAAGAT CTACGAGAT CTACCTCACACT GCACAAG 1620 

Qy 1666 CC GGAAGAC GT GAGGTT G C C C CTAGCT GGCT GT CAGAC C C T GCT GAGT C C CAT C GTT AGC 1725 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1621 C C AGAAGAC GT GAG GT T GC C C CT AGC T GG CT GT CAGAC C CT GCT GAGT C C AGT C GT TAGC 168 0 

Qy 1726 TGTGGACCCCCT.GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I M II I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 174 0 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 
Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 18 00 

Qy 184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 19 05 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 18 60 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Ml I MINIM I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 192 0 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 198 0 

Qy 2 026 TCCCT CGAGT ACAACATCC GGGTCTACT GCCT GCAT GACACCCACGATGCACTCAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I II I I I I 
Db 1981 T CCCTT GAGTACAACATCCGAGT GTACT GCCTACACGACACCCACGACGCT CTCAAGGAG 204 0 

Qy 2 086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2 041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 

Qy 214 6 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 22 05 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 T T CAAAGACAGTT AC CACAAC CT ACGT CT CT C CAT C CACGAC GT GC C CAGCT CC CT GT GG 2160 

Qy 2206 AAGAGTAAG CT C CT T GT C AGCTAC CAG GAGAT C CCCT T TTAT CACAT CT GGAAT GGCAC G 2265 

I I I I I I I I I I I I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AAGAGCAAG CT ACT T GT CAGCT AC CAG GAGAT CCCTT T TT AC CACAT CT G GAAC G GCAC C 2220 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

I I I I III I I I I II I I I I I I I I I I I I I I II I I I III I MINIMI I I I I I I 
Db 2221 CAGCAGT AT CT GCACTGCAC CTT CACCCT GGAGC GCATCAACGCCAGCACCAGCGACCTG 228 0 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I M I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II 
Db 2281 GC CT G CAAG GT GT GG GT GT GGCAGGT G GAGGGAGAT G GGC AGAGCT T CAACAT CAACTT C 234 0 



Qy 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 24 45 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AACAT CACT AAGGACACAAGGTT T GCT GAAT T GT T GGCT CT GGAGAGT GAAGG GGGG GT C 2400 

Qy 244 6 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || 
Db 2 4 01 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 24 60 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II I I I I I MINIMI I I I I I I II II II M M I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I 
Db 2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | I Ml 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2 64 0 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 27 45 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM I 

Db 2 641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 2700 

Qy 274 6 CGGCCAG 2752 

I I II M 

Db 27 01 CAGCCAG 2707 
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Qy 4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 




Db 



61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 



Qy 



166 GAC CTGCTTCCC C ACTT C CT GGT GGAGC CC GAGGAT GT GT ACAT C GT CAAGAACAAG C CA 225 





Db 



121 GACCTGCTGCCCCACTTCCTGGTAGAGCCTGAGGACGTGTACATTGTCAAGAACAAGCCG 180 



Db 




Qy 



2 8 6 T GG GT GC GCCAGGT GGAC CAC GT GAT C GAGC G CAGCACAGAC GGGAGC AGT G GGCT GC C C 34 5 



Db 



241 T GGGT CC G CC AGGT C GAT CAC GT AATT GAAC GCAGCAC C GAC AG C AGCAGC GGAT T GC C A 300 



Db 



Qy 



34 6 AC CAT GGAGGT C C G CAT T AAT GT CT CAAGGC AGC AGGT C GAGAAG GT GT T CGGG C T GGAG 4 05 

I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AC CAT GGAGGT CCGT AT CAACGTAT CGAGGCAGCAGGTAGAGAAAGTGTTT GGGCT GGAG 360 



Qy 



4 06 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 4 65 





Db 



361 GAAT ACT GGT GC CAGT GT GT G GCAT GGAGCT C CT C GGGT AC CACCAAAAGT C AGAAGG C C 420 



Qy 



4 66 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 
I I I I I I I I M III I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I III 



Db 421 T ACAT C C G GATT G C CTAT T T GC GCAAGAAC TT T GAGC AGGAG C CACT GGC CAAGGAAGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I II I I I Mill II II II II || II II II II I I I I I I I I I I III 
Db 481 T CACT G GAG CAAGGCATT GT AC T AC CT T GT C G C C C C CCAGAAGGAAT CC C CC C AGCT GAG 54 0 

Qy 58 6 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 7 06 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 72 0 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 78 0 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 88 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 88 6 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

Mill I I I I I I I I M I II I I I I I I I I I I I M I I II I I I I I II I I I I II I II II I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGAC 1065 

II I II I II I II I I I I I II I I I I I II I Mill I I I I II I I I III I I II I I II II I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 102 0 

Qy 1066 AC C C GC AACT GT AC CAGT GAC CT CT GT GT AC AC AGT GCTTCTGGCC CT GAGGAC GT GG C C 1125 

I I I I I I I I I I I I I I I II I I I I I I I II I I II I MIMI I I I I I II II I I I II I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 10 8 0 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

Mill I I I II I I II I II II I I I I II I I II I II I I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 12 45 

Ml I I II II II I I I I I I I I I I I I II I I I I I M I I I I I I I I I I II I I II I III 
Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1305 

Mill II I I I I I I II I I I I I II II I II II I I I I I M I I I II I I I II I II I I I II I II 
Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 12 60 

Qy 1306 AC CAT C C AG C C G GAC CT C AGC AC C AC C AC C AC C AC C T AC C AGG G CAGT CTCTGTCCCCGG 1365 

M I I M I I I II II I I II I I I II II II I I I II I I I II I I I II M II II I III I M 
Db 1261 AC CAT C CAG C CAGAC CT CAG CAC C AC CAC T AC C ACCT AC CAGGGCAGT CT AT GT T C GAG G 1320 



Qy 


1366 


CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 


1425 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 II 1 1 II 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 Mill 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 


1380' 


Qy 


1426 


GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 

1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M | 1 1 1 | 1 1 M 1 1 I 1 1 1 1 1 1 1 1 1 1 1 


1485 


Db 


1381 


1 1 1 1 1 1 1 1 1 II 1 1 1 | | | | | | | | | | | | || 1 | | | II | II | | M | | M | | | | | | 1 

AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 


1440 


Qy 


1486 


CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 


1545 






I I I i i i i i i i i i i i i i i i i i i i ii i i i i i i i i i i i t i i i i i i t i i i i i i i i i i i 
I I l I I 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I II I I I I 1 M 1 II II II M 1 1 1 1 1 1 1 




Db 


1441 


CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 


1500 


Qy 


1546 


GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 


1605 






1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I t I I I I I I I I it I I I i i i i i i i i i 

1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II I I M 1 II 1 II 1 1 




Db 


1501 


GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 


1560 


Qy 


1606 


AT C C C C C C AGAT GC C AT AC C C C GAGGGAAGAT CT AT GAGAT C T AC CT C ACGCT G CACAAG 


1665 






ii i i i i i i i i i i i i i i M i i i M i i i i i i i i i i i i i i i i i i i i t i i i i i 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 




Db 


1561 


AT AC C C C C G GAT G C CAT C C C C C GAG GAAAG AT C T AC GAGAT C T AC C T C AC AC T G CACAAG 


1620 


Qy 


1666 


CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 


1725 






II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 l i l l l l l I i i i i i i i i i i i i 
II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | I | | | 1 1 1 1 1 1 1 1 




Db 


1621 


CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 


1680 


Qy 


1726 


TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 


1785 






i 1 1 1 1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 E 1 ( 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 II 1 1 I I I I I I I I i i i i 

Mill 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


1681 


TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 


1740 


Qy 


1786 


GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 


1845 






i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i i i < i i i iii 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 III 




Db 


1741 


GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 


1800 


Qy 


1846 


GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 


1905 






i i i i i i i i i i i i i i i i i ii i i i i i i i ii i i i i i i i i i i i i i i i i i i i i i i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1801 


GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 


1860 


Qy 


1906 


GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 


1965 






mi i i i i i i i i i i i i i i i i i i i i i i i i i i i i i \ i i i i i i \ i i i i i i < i i i i i i i i 
IN i 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 II 1 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1861 


GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 


1920 


Qy 


1966 


CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 


2025 






l l l I i i i i i i i i i i i i i i i i i i i i i i i iii i i i i i i i i i i i ii i i i i i i i i ii 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 




Db 


1921 


CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 


1980 


Qy 


2026 


T C C CT C GAGT AC AAC AT C C G GGT CT ACT GC CT GC AT GAC AC C C AC GAT GC AC T CAAG GAG 


2085 






Mill II II 1 1 1 1 1 1 I 1 1 1 II 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 I I II l l I l I i I I I 

HIM 1 1 1 1 1 1 1 1 1 1 M II II 1 1 1 1 I 1 1 1 II 1 1 1 1 1 1 1 1 I I I II I 1 I I || | | | 




Db 


1981 


TCCCT T GAGT ACAAC AT C C GAGT GT ACT GCCT AC AC GACAC C CAC G AC GCT CT CAAGGAG 


2040 


Qy 


2086 


GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 


2145 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


2041 


GT GGT GCAG CT G GAGAAG C AGCTAG GT GGACAG CT GAT C C AGGAGC CT C GCGT CCT G CAC 


2100 


Qy 


2146 


T T C AAGGAC AGT T AC CAC AAC C T GC GC CT AT C CAT C CAC GAT GT G C C CAGCT CCCTGTGG 


2205 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 M 




Db 


2101 


TTCAAAGACAGTTACCACT^CCTACGTCTCTCCATCCACGACGTGCCCAGCTCCCTGTGG 


2160 



Qy 


2206 


AAGAGT AAGCT CCT T GT C AG CTAC CAGGAGAT CC C CT T T TAT C ACAT CT GGAAT GGC AC G 


2265 






\ M 1 1 1 1 1 1 MM 1 1 1 1 1 Mill 




Db 


2161 


AAfiAnrAAnrTArTTCITrAf : irTArrArrfirQ , T , r , r , r , T r P r T ir rTnr , r , 7\r , 7\ r T i r' r nrr , a ~rs.ccccn.cc 
r^^\\3t\yj\^ir\t^x^^ i al. x. j. vj± \^t-\sj ^ j. L-nb \jJ-\\jI\ 1 LL.L 1 ill 1 Ab b Ab A 1 Li b b/ YAb buLAL-L 


99 i n 
ZZ Z U 


Qy 


2266 


CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 


2325 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 I I I I IN | I | I I | I | II I 1 1 1 1 1 




Db 


2221 


^-tuj ^-tUj irtibi i til bbAbb b LA i bAAb bb bAb bAb b Abb bAb Lib 


ZZ o U 


Qy 


2326 


GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 


2385 






1 1 M M 1 II Ml Mill M 1 1 M 1 II 




Db 


2281 


(^CCTC,C AA^f^T'CT'CCC^C^CCCAC.C.'VCCTs.cr'r'Ts c* n n r n i\ r* ~\ r* r*~v~r* c* i\ a r* 7\ m r« a tv r^ramr* 
1 ^^nnobi o 1 ^jVj^j 1 k3 1 <cr^w-ujbi 1 bb/\bbbAbAl bbbbAbAbb 1 i bAALAi LAAL lib 




Qy 


2386 


AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 


2445 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 II 1 1 1 1 1 1 1 




Db 


2341 


AATATPATTA Anf^Z\rZ\rA ArrTTTTfTr A n r r r Pr r r r Prrp r PP r rr , r , 7\ r , 7\r , rrr , 7\ 7\r , r i r , /^r , r , r , fTir' 
^lrU_.rt± ^--tt-^ 1 rtf\KD\jI\^f\^lAf\\j{3 1 1 IbLlbAAl Ibl 1 bbL 1 b 1 bbAbAbl bAAbbbbbbbl b 


^400 


Qy 


2446 


CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 


2505 






1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


94 01 


CC A fZC C C~V CC r V CC C C C C C Ar r Prr , r r P , rr , a Ar , A r rr , r < r , prprnr , r , fTip7\mfTir'r , r , r'7v -a 7\ npT\mr<7\m^ 
LbAbbLL-J. bbl bbbbbbbAbl bbbl IbAAbAlbbbbl 1 bb 1 bAl 1 bbGCAAAAGATCATC 


24 60 


Qy 


2506 


TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 


2565 






1 1 1 1 II 1 1 M II II II M II 1 1 1 II M 1 1 1 M M 1 M M 1 II II 1 1 1 1 1 M 




nh 




C,CC7X(Z^C^CC7±CCCl\CCCT , CCACCCCCCCCCCCCTir~~vr~r'7\r'T\ t\ r ,r T i r , mAr , r*r , PTi r* i\ -n t\ ^mm 
1^1 bbAbbbAbbbl bbAbbbbbbbbbbbbAb 1 bbAbAAbl b 1 AbbbbAGAAACTT 


2520 


Qy 


2566 


CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 


2625 






M II 1 1 II II M 1 II II 1 II 1 II 1 1 1 II 1 II 1 M II 1 1 1 II II 1 M II II 1 1 II II II 




Db 


9S91 

vJ Z. J. 


b/ibb 1 bbAbAbt LAI b 1 lAbbl Ibi 1 1 bbb 1 bbAAbb bbAbb bb lAbAbbbAT GAT CCTC 


2580 


Qy 


2626 


AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 


2685 






M 1 M IMM II M 1 II MINI II II M M III 








Art^LlAl bbbAbbLALbbLAL 1 1 bbbbAAbbbbAAbb 1 bbbbbAbbTGGCAGCAGCTGTG 


2640 




Z O O O 


bbl bbALl bbb L LAbL LAbAL b L 1 bbbbl bl 1 bACAGTGTCGGAGGCTGAGTGCTGAGGC 


2745 






M M 1 M II II I 1 1 1 II 1 1 II II II II II 1 II II II II II II 1 1 II II II 1 1 1 




Db 


2641 


GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 


2700 


Qy 


2746 


CGGCCAG 2752 




Db 


2701 


1 Mill 

CAGCCAG 2707 




RESULT 


7 






US-10- 


240-154- 


15 




; Sequence 15, 


Application US/10240154 




; Publication 


No. US20030175741A1 





GENERAL INFORMATION: 
APPLICANT: Cochran et al . 

TITLE OF INVENTION: SCHIZOPHRENIA RELATED GENES 
FILE REFERENCE: CKFW-P01-006 
CURRENT APPLICATION NUMBER: US/10/24 0,154 
CURRENT FILING DATE: 2001-04-02 
PRIOR APPLICATION NUMBER: PCT/GB01/ 01486 
PRIOR FILING DATE: 2001-04-02 
NUMBER OF SEQ ID NOS : 34 
SOFTWARE: Patentln version 3.2 
SEQ ID NO 15 
LENGTH: 2697 



TYPE: DNA 

ORGANISM: Rattus sp . 
; FEATURE: 
; NAME/ KEY: CDS 

LOCATION: (1) . . (2697) 
US-10-240-154-15 

Query Match 81.8%; Score 2252.2; DB 15; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I II I I I 

Db 121 GAC CT GCT G C C CCACTT C CT GGT AGAGC CTGAG GACGT GT ACAT T GT CAAGAACAAGC C G 180 

Qy 22 6 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 2 85 

I I I M I I I I I I I I I M I I I I I I Mill I I II II I II I I M I I I I I II I I I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 24 0 

Qy 2 86 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I I I I II I II I I II II I II I I II I III I I II I I II II I I 
Db 241 TGGGTCCGCCAGGTCGATCACGTAATTGAACGCAGCACCGACAGCAGCAGCGGATTGCCA 300 

Qy 34 6 AC CAT GGAGGT CCGCATT AAT GT CT C AAGGCAGCAGGT CGAGAAGGT GTT CGGGCTGGAG 405 

I I M I II I I I I M I II II II II II I II II I I I I II I I I II I II I I II I I I II 
Db 301 AC CAT GGAG GT C CGT AT CAAC GT AT C GAGGCAG CAGGTAGAGAAAGT GTTT GG GCT GGAG 360 

Qy 4 06 GAATACTGGTGCCAGT GCGT GGCAT GGAGCT C CT CGGGCACCACCAAGAGTCAGAAGGCC 465 

M I I II II I I I I I II II II II I I I I I II I I II I II II I I II I I I I I I M I I II I II I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 466 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I M I I I I II III II I I II I II I II I I I II I I II II I I II I II I I II II III 
Db 421 T ACAT CC G GAT T GC CT ATTT GC G CAAGAACT TT GAGCAGGAG C CACT GGCCAAGGAAGT G 4 80 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

M. I II M I II II I II II II II II || || || M II I I I I I I I I II III 
Db 481 TCACTGGAGCAAGGCATTGTACTACCTTGTCGCCCCCCAGAAGGAATCCCCCCAGCTGAG 540 

Qy 58 6 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

I I M I II I I I I II II II I II I I I I I I II II I I I II I II I II I I I II I II I I I 

Db 541 GT GGAGT G GCT T CGAAAT GAGGAC CT C GT G GAC CCCTCCCTC GAT C C CAAT GT GT ACAT C 600 

Qy 64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

M I I I M M I II II I I I M I I I II II II II II II I II I I II II II II I I M II M 
Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 7 06 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I II I I I I I I I M I I I M I II III I I II II II II I II II II 



Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 72 0 

Qy 7 66 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 82 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 78 0 

Qy 82 6 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II Ml 

Db 841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACTCTGTGCCCAGTGGATGGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT G CT C T GAC C CAGC AC C C C GCAACGGAG GGG AG GAGT GC C AG G G C AC T GAC CT GGAC 1065 

I I I I I I I I I I I II I I I I I I I I I I I I I Mill M M II I I I III I I I I I I I II I I 

Db 961 GAGTGCTCTGACCCAGCACCCCGCAATGGAGGTGAGGAGTGTCGGGGTGCTGACCTGGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

II I II I II II M I I I I I I I I II II M I MM II II I I II I I I II II II I I II 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 108 0 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

Mill I I I II I I I II I I I II M I I I I I II I I I I I I II I I I II 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 118 6 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I II II II I I I I I I I I II I I II I II II I I II I I I I I II I II II I I I II I 

Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 12 00 

Qy 12 4 6 AC C T CAGG CT T C C AGC C C GT CAGC AT C AAGC C C AGCAAAGCAGAC AAC C C C CAT CT GCT C 1305 

II I II I I I I II I I II I II I I I I I II I I I I I II II I I I I I I I I I I I M I I I I I I I I I I 
Db 12 01 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 12 60 

Qy 1306 AC CAT C C AGC C G GAC CT C AG C AC C AC C AC CAC C AC CTAC C AGGGC AGT CTCTGTCCCCGG 1365 

II I II I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I II I I III I II 
Db 12 61 AC CAT C CAG C CAGAC CT CAGC AC CAC CACTAC CAC CTAC C AGGGCAGT CTAT GTT CGAGG 1320 

Qy 13 66 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

II I II I I I I I M I I I I I I I II II I I I II I I I II I I I I I I I I I II II I I I I I I I I 
Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 138 0 

Qy 142 6 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

I M I I I I II II II I II I II I I I I I I I I I I M II I M I I II I I I II I II I I I I 
Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

II II I II II I II I I I I I I II I I II I M I I I I I I I I I I II I I I I I I II II I II I I 
Db 14 41 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

M I II I I II I I I I I II I I II I I II I II II II II M I I I II I I II II II I I I I I I I I M 
Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 



Qy 1606 AT C C C C C C AGAT G CCAT AC C C C GAGG GAAGAT C TAT GAGAT CT AC CT CAC G CT GCACAAG 1665 

II I M I I I I I I I I I I I I II II I I MINIM I I I I I I I I I I I I M I I I I I I I II 
Db 1561 AT AC CCCC GGAT GCCAT CCCC CGAGGAAAGAT CTAC GAGAT CTACCT CACACT GCACAAG 162 0 

QY 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 CCAGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCAGTCGTTAGC 168 0 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I Mill II I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1786 GAG C C C AGC C C T GAC AGC T GGAG CCTGCGCCT CAAAAAG C AGT C GT GC GAG GGC AG CT GG 18 45 

II I I I I II I I I I I I I I I I I I I I I I I | | | | | | | | | | I I I II II I I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 18 00 

Qy 184 6 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 192 0 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 202 5 

M M II | | | | II I I I II I II I I I I I I I I I I I II I 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 198 0 

Qy 2 02 6 T CCCT C GAGTACAACAT CCGGGT CTACT GCCT GCAT GACACCCACGAT GCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I 

Db 1981 T CCCTT GAGTACAACAT C CGAGT GTACTGCCTACACGACACCCACGACGCTCT CAAGGAG 2040 

Qy 208 6 GTGGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT CCAGGAGCCACGGGT C CT GCAC 2145 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GT GGTGCAGCT GGAGAAGCAGCTAGGT GGACAGCT GATC C AGGAGCCT CGCGTCCT GCAC 2100 

Qy 214 6 T T C AAGGACAGT T AC C AC AAC CT GC G CCT AT C CAT C CAC GAT GT GC C C AGCT C C CT GT GG 2205 

I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I II I I I I I I I I 

Db 2101 T T C AAAG AC AGT T AC CAC AAC C T AC GT C T C T C CAT C CAC GAC GT G C C C AG CTCCCTGTGG 2160 

Qy 2206 AAGAGT AAGCT C CT T GT C AG C T AC CAG GAGAT C C C CT T T TAT C AC AT CT G GAAT GGC ACG 2265 

I I I I I I I I I I I I I I I I I II I I I I I I I I I M I Ill I I I I I 

Db 2161 AAGAGCAAGCTACTTGTCAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 222 0 

Qy 2266 C AGC GGT ACT T GCACT GCAC CT T CAC C CT GGAG C GT GT CAG C C C C AGC ACT AGT GAC C T G 2325 

I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I I I I I 
Db 2221 CAGCAGTATCTGCACTGCACCTTCACCCTGGAGCGCATCAACGCCAGCACCAGCGACCTG 2280 

Qy 232 6 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 238 6 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 

I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
Db 2341 AACATCACTAAGGACACAAGGTTTGCTGAATTGTTGGCTCTGGAGAGTGAAGGGGGGGTC 2400 



Qy 

Db 



2446 
2401 



CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 

I I I I I I I I I I > I I I I I I I I I I I M I I I I I I I I I I I I I I I II 

CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 



2505 
2460 



Qy 


2506 


TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 


2565 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II II 1 




Db 


2461 


u^urt\ji v_- 1 kj\j/\^k^'^i-\Xs'^^ i ^^/\^L*L-o^<c»oU^^L.tcrAU 1 b/\b/\AL i U 1 AG L, L. L ALrAAAL i 1 


O R O A 

ZD/. 0 


Qy 


2566 


CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 


2625 






1 1 1 M 1 1 1 1 1 M 1 1 1 M 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 | 1 | | || | 1 1 1 I | | 1 1 1 1 1 1 1 1 1 




Db 


2521 


CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 


2580 


Qy 


2626 


AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 


2685 






Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 




Db 


2581 


AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 


2640 


Qy 


2686 


GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 Mill 1 II 




Db 


2641 


GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 


RESULT 


8 






US-09- 


933-261- 


-2 




; Sequence 2, 


Application US/09933261 




; Publication 


No. US20030040046A1 





GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
Leonardo, E. David 
Hink, Lindsay 
Masu, Masayuki 
Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES : 8 
CORRESPONDENCE ADDRESS : 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/933, 261 

FILING DATE: 20-Aug-2001 

CLAS S I FI CAT I ON : <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/808,982 

FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME : OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 



TELEPHONE: (415) 343-4341 
TELEFAX : (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1787 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-09-933-261-2 

Query Match 56.8%; Score 1562.4; DB 10; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 

GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I | | | | M | 
GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 118 9 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1249 
I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 179 

C AG G C T T C C AG C C C GT C AG CAT C - AAG C C C AG C AAAG C AG AC AAC C C C CAT C T G C T C AC C 1308 

I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAG GCT T C C AGCC C GT C AGC AT CT AAGC CC AGCAAAGC AGACAAC C C C CAT CT GCT CAC C 239 

ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 1368 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 299 

GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I 

GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 1488 
M I I II II I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I II I I I I I II I I I II I I I I 
GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 419 

CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 479 

ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 1608 
M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I 
ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

C C C C CAG AT G C CAT AC C C C GAG G G AAG AT C TAT GAG AT C T AC C T CAC G C T G CAC AAG C C G 1668 

I I I M I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 

C C CC CAGAT GC CAT ACC C C GAG GGAAGAT CT AT GAGAT CT AC CT CAC GCT GC ACAAGC C G 599 



Qy 


1070 


Db 


1 


Qy 


1130 


Dd 


60 


Qy 


1190 


Do 


120 


Qy 


XZdu 


DD 


1 80 


Qy 




Db 


240 


Qy 


1369 


Db 


300 


Qy 


1429 


Db 


360 


Qy 


1489 


Db 


420 


Qy 


1549 


Db 


480 


Qy 


1609 


Db 


540 



Qy 



1669 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 1728 



600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 
1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 17 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | I I I I I I I I I I I I I I I M I I 

660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

17 89 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 18 4 8 

I I I I I I I I II II I II I i I I II I I II I I I MINIMI 

720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I | I | | | ( | | | | | | | | | | | | | | | 

77 9 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 
I M I I M I M I I I M I I M I I II I I I M I I I I M I I I I I I I I II M I I I M M I I M I I I 
838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 202 8 
I I I I M I I M I I I I I I I I I I I I M II I I I I II I I M M I I I I I I II I I I I I I || I I I I | | 
8 98 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

202 9 CT C GAGT ACAAC AT C C GGGT C TACT GC C T GC AT GAC AC C C AC GAT GC AC T C AAGGAGGT G 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

958 CT C GAGT ACAAC AT C C GG GT CT AC T GC CT G CAT GACAC C C AC GAT GC AC T C AAG GAG GT G 1017 

2089 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 214 8 

Ml I M I I I I I I I I I I I I I I I I II I I I I II I I I I I I I II I M I I I I I I | | || 

1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

214 9 AAGGAC AGTTAC CACAAC CT GC G CCT AT CCAT CCAC GAT GT GC C C AGCT CCCT GT GGAAG 22 08 

I I I I I I I I I I I I I I I I I I I I Ml I I I I I II I I I I I I I I I I I I I I I I M I I I I I I 

1077 AAG G AC AGT T AC CACAAC CT — GCCC TAT CAT C C AC GAT GT G C C C AG CTCCCTGTG GAAG 1134 

2209 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 22 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 
1135 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 1194 

2269 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | I I I I I I I I I I I I I I I I I I 
1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I | | I I | | | | | | | | | | | | | | | | | | | | | | 

1255 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2 4 4 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | 
1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

244 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 14 34 



2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I M I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 



Db 



1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 14 94 



Qy 



2569 CT G GAC AGC CAT CT C AG CT T CTT T G C CT CCAAGC CCAG C C C C ACAGC CAT GAT C C T CAAC 2 62 8 




Db 



14 95 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 1554 



Qy 



2629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 268 8 




Db 



1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 



Qy 



Db 




Qy 



2747 GGCCAG 2752 



Db 



1675 GGCCAG 1680 



RESULT 9 
US-10-256-702-2 

; Sequence 2, Application US/10256702 
; Publication No. US20030059859A1 
GENERAL INFORMATION: 



TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 

STREET: 268 BUSH STREET, SUITE 3200 

CITY: SAN FRANCISCO 

STATE: CALIFORNIA 

COUNTRY: USA 

ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 10/256, 702 

FILING DATE: 27-Sep-2002 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/09/933,261 

FILING DATE: 20-Aug-2001 

APPLICATION NUMBER: 08/808,982 

FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 



APPLICANT: Tessier-Lavigne, Marc 



Leonardo, E. David 
Hink, Lindsay 
Masu, Masayuki 
Kazuko, Keino-Masu 



TELEPHONE: (415) 343-4341 
TELEFAX: (415) 343-4342 
INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH : 1787 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
US-10-256-702-2 



Query Match 56.8%; Score 1562.4; DB 15; Length 1787; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1661; Conservative 0; Mismatches 16; Indels 9; Gaps 8; 



Qy 


1070 


GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 


1129 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 I I I | | | | | | | | | 




DD 


1 


GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 


59 


Qy 


1130 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


1189 






1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 I I I I | I | | 




nk 


bU 


ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 


119 


Qy 


1190 


TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 


1249 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 | 1 II 1 1 1 1 1 1 1 1 | | | | | M | | | 




DD 




TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 


179 


Qy 


1250 


CAGGCTTCCAGCCCGTCAGCATC-AAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACC 


1308 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


Ton 


CAGGCTTCCAGCCCGTCAGCATCT7^GCCCAGCAAAGCAGAC7\ACCCCCATCTGCTCACC 


239 


Qy 


1309 


ATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 


1368 






1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 








AIOLAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAG 


299 


Qy 


1369 


GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 


1428 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


300 


GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 


359 


Qy 


1429 


GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 


1488 






1 M 1 1 1 1 1 M M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


360 


GGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGC 


419 


Qy 


1489 


CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 


1548 






1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


420 


CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 


479 


Qy 


1549 


ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATC 


1608 






1 1 1 M 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 




Db 


480 


ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 


539 


Qy 


1609 


C C C C C AGAT G CCAT AC C C C GAGG GAAGAT CT AT GAGAT C T AC CT C AC G CT GC AC AAG CC G 


1668 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


540 


CCCCCAGAT GCCATACCCCGAGGGAAGAT CTAT GAGAT CTAC CTCACGCT GCACAAGC CG 


599 


Qy 


1669 


GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 


1728 



600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 
172 9 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I M I I I 1 1 1 M I 1 1 I 1 1 I I I I I 1 1 1 1 1 1 1 1 1 I I I 1 1 1 i I I 1 1 I I 1 1 1 I 1 1 1 1 1 1 1 | 

660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

178 9 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

HI I II I I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I | I I I I I 

72 0 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

184 9 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 
Mill II I I I I I I I I | I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

779 GATGT-CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 837 

1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

2 029 CTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTG 208 8 
I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 
958 CT C GAGT ACAACAT C C G GGT CT ACT GC CT GC AT GACACCCACGAT GCACT CAAGGAG GT G 1017 

2089 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTC 214 8 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I | | | | | | | | | | M I I II 

1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTT- 1076 

214 9 AAG GACAGT T AC C ACAAC CT GC GC CT AT C CAT C CAC GAT GT GC C CAGCT C C CT GT G GAAG 2208 

I I I M I I II I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1077 AAGGACAGTT AC CACAACCT — GCCCTAT CAT CCACGATGT GC CCAGCT CC CTGT GGAAG 1134 

2209 AGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAG 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | 
1135 AGTAAGCT C CT T GT CAGCTAC CAGGAGAT CC CCT T TT AT CACAT CT GGAAT GGC ACGCAG 1194 

22 69 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 1254 

2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 2388 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | M I 

12 55 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 1314 

2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 2448 

N I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 1374 

24 4 9 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I | | | | | | | | | | | | | 
1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 
I I I I I I I I I I I I I I I I I I I I I I I I I I I | M 



1435 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 1494 

2569 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 2 628 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
14 95 CTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAAC 1554 

2629 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | | 
1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 2746 

II I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

2747 GGCCAG 2752 

I I I I I I 
1675 GGCCAG 1680 



RESULT 10 
US-10-296-115-365 

; Sequence 365, Application US/10296115 
; Publication No. US20040053248A1 
; GENERAL INFORMATION: 
; APPLICANT: Hyseq Inc 

; TITLE OF INVENTION: No. US2 004 005324 8Alel Nucleic Acids and Polypeptides 
; FILE REFERENCE: 784PCT 

; CURRENT APPLICATION NUMBER: US/10/296,115 

; CURRENT FILING DATE: 2002-11-18 

; PRIOR APPLICATION NUMBER: US09/488,725 

PRIOR FILING DATE: 2000-01-21 
; PRIOR APPLICATION NUMBER: US09/552,317 
; PRIOR FILING DATE: 2000-04-25 
; NUMBER OF SEQ ID NOS : 1478 
; SEQ ID NO 365 
LENGTH: 1321 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-296-115-365 



Query Match 43.8%; Score 1206.6; DB 13; Length 1321; 

Best Local Similarity 98.0%; Pred. No. 1.6e-296; 

Matches 1295; Conservative 0; Mismatches 19; Indels 7; Gaps 7; 



Qy 


1435 


CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 


1494 


Db 




1 1 M M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




1 


CACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCC 


60 


Qy 


1495 


ACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTC 


1554 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


ACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTC 


120 


Qy 


1555 


AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCA 


1614 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 I | M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 




Db 


121 


AACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATCCCCCCA 


180 


Qy 


1615 


GAT GC CAT ACC C CGAGG GAAGAT CT ATGAGAT CT AC CT CAC GCT GCACAAGC C GGAAGAC 


1674 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



Db 


181 


M 1 M 1 M III llllll Mill II 1 MM 1 1 1 II II M 1 II MM MM 1 III MM Ml 

GATGCCATACCCCGAGGGAA.GATCTATGAGATCTACrTCArGrTnrAr A Ar^rrrr a Arzxr 


Z 4 (J 


Qy 


1675 


GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCC 

Ill IMIIIMIIIIIIMI Mill 1 MMIMMMMIMMIM IIIIMM 

GTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGArrr 


1 1 O A 

1/34 


Db 


241 


jUU 


Qy 


1735 


CCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT-GGCTATGGACCACTGT-GGGGAGCCC 
HI 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 
CCTGGGCGTCCTGCTTACCCGGCCAGTCATCCTGGGGTAT^GArrAPTrTrrrrrarrrr 


i / y i 


Db 


301 


^ C C\ 


Qy 


1792 


AGCCCTGACAGCT-GGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 

AGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAnrAr^Trn r rrrr2\rrrr , arrT'r'r-/"Ar-r-7\ 


n o a r\ 


Db 


361 


/ion 

420 


Qy 


1851 


TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAG 

1 N 1 II 1 II II II M M 1 M 1 II II II M II 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 

TGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT ACT APTrrrarrTnr a rrrrnr 


1910 


Db 


421 


/on 
480 


Qy 


1911 


TGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 

TGCCTGCTACGTCTTCACCGAGCAGCTGAGCCCirTATarrrTrrvrrr&rTirrnrrrnr'-r\r- 


1970 


Db 


481 


540 


Qy 


1971 


CGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I 1 1 1 1 I 

CGTGGCTGCCGCCAAGCGCCTCAAGCTGrTTrTr;TTT^rrrrrr r rrrr-nfr^r«7\r < r-rpr-r-^m 


2030 


Db 


541 


600 


Qy 


2031 


CGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGT 
1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I 1 1 1 
C GAG T AC AAC AT AC T G GT C T AC T G C C T G C A T G A C A r T r A r a a t r r a r t r a a r r t a r- m r* r- m 


2090 


Db 


601 


r r n 

660 


Qy 


2091 


GCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | 1 1 III 1 1 1 1 1 1 II 1 1 1 
G C AG CT G GAGAAG CAGCT GCAGGGAC AGC T GAT C C Ann A cr r a pt r r t a pt re a r 1 t t n a a 


T1 TA 

2150 


Db 


661 


-7 o n 
/20 


Qy 


2151 


G GAC AGT T AC C ACAAC CT GC G C C TAT C CAT C C AC GAT GT GC C CAGCT C C CT GT GGAAGAG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 II II M 1 1 II M 1 1 1 II 1 1 1 1 1 1 

GGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGrrrA^PTrrrTrTrraarar- 


2210 


Db 


721 


1 O A 


Qy 


2211 


T AAG CT C CT T GT C AG CT AC CAGGAGAT C C C CT T TT AT C ACAT CT G GAAT GGC AC GCAGC G 

N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | 1 1 1 1 1 1 1 1 

TAAGCTCCTTGTCAGCTAC CAGGAGATCCCCTTTTATT AT ATPTrrAaTrrrarrr a r-r'r" 


o o i r\ 

22 70 


Db 


781 


o /i n 
840 


Qy 


2271 


GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGPrrrAnrArT'ArTrarrTr'rr'r'^r" 


2330 


Db 


841 


900 


Qy 


2331 


CAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACAT 
1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 I 1 1 1 | | | | | | | | || | | | | | | | | | | | M 1 II 1 1 
CAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTrA^r ATPAArTTraaraT 


o o o n 
Zo9 U 


Db 


901 


you 


Qy 


2391 


CACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGC 
■ itiiii itiii ■■■■■■ iii.. 

1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGC 


2450 


Db 


961 


1020 


Qy 


2451 


CCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 M 1 1 1 1 II 1 1 1 1 1 1 1 II 1 I | | | | | | | | | | | | | | | | | | | 


2510 



1021 CCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAG 1080 

2511 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCT 257 0 

I I I I I I I I I I M I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 

1081 CCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAG7WVCTCCACCT 114 0 

2571 G GAC AG C CAT CT CAGCT TCTTTGCCTC CAAGC C C AGC C C C AC AGC C AT GAT C C T CAAC C T 2630 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1141 GGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCT 1200 

2 631 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT-G 268 9 

I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | || I I I I I I I I I I 

1201 GTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGG 1260 

2690 GACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCCG 2747 

I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 GACTGGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCCG 1320 

2748 G 2748 
I 

1321 G 1321 



RESULT 11 

US-09-833-381-1806 

; Sequence 1806, Application US/09833381 

; Patent No. US20020132090A1 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. US20020132 090Alel Nucleic Acid and Protein Homologs 

FILE REFERENCE: 58 00-119 
; CURRENT APPLICATION NUMBER: US/09/833, 381 
; CURRENT FILING DATE: 2001-04-11 
; PRIOR APPLICATION NUMBER: 09/516,448 
; PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2050 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1806 

LENGTH: 1282 

TYPE: DNA 

ORGANISM: Homo sapiens 

FEATURE : 
; NAME/KEY: mis cofeature 

LOCATION: (1) ... (1282) 

OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-1806 

Query Match 42.0%; Score 1155.8; DB 9; Length 1282; 

Best Local Similarity 98.2%; Pred. No. 1.3e-283; 

Matches 1263; Conservative 0; Mismatches 13; Indels 10; Gaps 9; 

Qy 1469 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 1528 

I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 

Db 1 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 60 

Qy 1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1588 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



61 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 12 0 
1589 CAGGTATCAGCCT C CT CAT C CCCCCAGAT GC CATACC C C GAGGGAAGAT CT AT GAGAT CT 164 8 

MM 'Ml Ml M I M I M I II I MM III I I | I I | II I I III I I I Mill I II Ml I I 

121 CAG GAAT C AG C CT C CT C AT C CCC C CAGAT GC C ATAC C C C GAGGGAAGAT CT AT GAGAT C T 180 

1649 AC C T CAC GC T GC ACAAG C C G GAAGAC GT GAGGT T GC C C C T AGCT G GCT GT C AGAC C CT GC 1708 

I I i II II M M II M I I I I I I I I I I II I M I I M I M I I II M M M M 

181 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 24 0 

1709 TGAGTCCCATCGTTAGCTGTGGACCCCCT-GGCGTCCTGCTCACCCGGCCAGTCATCCT- 1766 

M I I I I I I I I I I I I I I I I I I I I I I I | M I I I II I II M I I I I I I I I I I I I I || 

241 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGGCGTCCTGCTCACCCGGCCAGTCATCCTG 300 

17 67 GGCTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCT-GGAGCCTGCGCCTCAAAAAGC 1825 

H I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
301 GGGTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGGAGCCTGCGCCTCAAAAAGC 360 

182 6 AGTCGTGCGAGGGCAGCTGGGAGGATGTGC-TGCACCTGGGCGAGGAGGCGCCCTCCCAC 1884 

I II I N I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I | | | || | | | | | | 

361 AGTCGTGCGAGGGCAGCTGGGAGGATGTGCTTGCACCTGGGCGAGGAGGCGCCCTCCCAC 420 

18 85 CTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGC 1944 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGAGCCGC 4 80 

1945 TTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTG 2 004 
I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 TATGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTG 540 

2005 TTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGAC 2064 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I 

541 TTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATACTGGTCTACTGCCTGCATGAC 600 

2065 ACC CACGAT GCACT CAAGGAGGT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT C 2124 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | 

601 ACT CAC GAT GCACT CAACGT AGT G GT GCAGC T GGAGAAG CAGCT GGG GGGAC AGCT GAT C 660 

2125 C AGGAG C CAC G G GT C CT GCACT T CAAG GAC AGT T AC C AC AAC CT GC GC CT AT CCAT C CAC 218 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCAC 720 

2185 GAT GT GC C CAGCT C C C T GT GGAAGAGT AAGCT C C TT GT C AGCTAC CAG GAGAT C CC CT T T 2244 

M M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | I I I I I I I I I I I 

721 GAT GT GC C CAGCT C C CT GT GGAAGAGTAAGC T C CTT GT C AGCTAC C AGGAGAT C C C CTTT 7 80 

2245 TATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTC 2304 

II I I I I I I I I II I I I I | | | I I I I I I I I I I I I I I I 

781 TATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTC 840 

2305 AGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGG 2364 

M I M I I I I I I I I I I I I I | | | | | | | | | I I I I II I I I I I I I I I 

841 AGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGG 900 

2365 CAGAGCTT CAGCAT CAACTT CAACAT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT 2424 
N N I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
901 CAGAGCTT CAGCAT CAACT T CAACAT CAC CAAG GAC ACAAG GT T T GC T GAG CTGCTGGCT 960 



Qy 2425 CTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTC 2484 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 961 CTGGAGAGTGAAGCGNGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTC 1020 

Qy 24 85 CTCATTCGGCAGAAGATAA-TTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTG 254 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CTCATTCGGCAGAAGATAATTTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTG 1080 

Qy 2544 GCGG-ACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGC 2 602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCGGAACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGC 114 0 

Qy 2603 CCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACC 2 662 

I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1141 CCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACC 1200 

Qy 2663 TCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAG 2722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TCAGCCAGCTGG-TGCAGCAGTGGCTGGACTGGGC — AGCAGACGCTGG-CTCTTCACAG 1256 

Qy 2723 TGTCGGAGGCTGAGTGCTGAGGCCGG 274 8 

I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1257 TGTCGGAGGCTGAGTGCTGAGGCCGG 1282 



RESULT 12 
US-10-087-684-1 

Sequence 1, Application US/10087684 
Publication No. US2004002 9116A1 
GENERAL INFORMATION: 
APPLICANT: Edinger, Shlomit R. 
APPLICANT: MacDougall, John R. 
APPLICANT: Millet, Isabelle 
APPLICANT: Ellerrnan, Karen 
APPLICANT: Stone, David J. 
APPLICANT: Grosse, William M. 
APPLICANT: Lepley, Denise M. 
APPLICANT: Rieger, Daniel K. 
APPLICANT: Burgess, Cathereine E. 
APPLICANT: Casman, Stacie, J. 
APPLICANT: Spytek, Kimberly A. 
APPLICANT: Boldog, Ferenc L. 
APPLICANT: Li, Li 

APPLICANT: Padigaru, Muralidhara 
APPLICANT: Mishra, Vishnu 
APPLICANT: Shenoy, Suresh G. 
APPLICANT: Rastelli, Luca 
APPLICANT: Tchernev, Velizar T. 
APPLICANT: Vernet, Corine A.M. 
APPLICANT: Zerhusen, Bryan D. 
APPLICANT: Malyankar, Uriel M. 
APPLICANT: Guo, Xiaojia 
APPLICANT: Miller, Charles E. 
APPLICANT: Gangolli, Esha A. 

TITLE OF INVENTION: PROTEINS AND NUCLEIC ACIDS ENCODING SAME 
FILE REFERENCE: 21402-214 CIP 



; CURRENT APPLICATION NUMBER: US/ 10/087 , 684 

; CURRENT FILING DATE: ,2 003-03-10 

; PRIOR APPLICATION NUMBER: 60/253,834 

PRIOR FILING DATE: 2000-11-29 
; PRIOR APPLICATION NUMBER: 60/250,926 

PRIOR FILING DATE: 2000-11-30 
; PRIOR APPLICATION NUMBER: 60/264,180 
; PRIOR FILING DATE: 2001-01-25 
; PRIOR APPLICATION NUMBER: 60/274,194 
; PRIOR FILING DATE: 2001-03-08 
; PRIOR APPLICATION NUMBER: 60/313,656 
; PRIOR FILING DATE: 2001-08-20 
; PRIOR APPLICATION NUMBER: 60/327,456 
; PRIOR FILING DATE: 2001-10-05 
; NUMBER OF SEQ ID NOS : 220 

SOFTWARE: CuraSeqList version 0.1 
; SEQ ID NO 1 

LENGTH: 2860 
; TYPE: DNA 

ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 

LOCATION: (59) . . (2857) 
US-10-087-684-1 

Query Match 34.0%; Score 936.2; DB 13; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 9e-228; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 



143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 
Ml Ml II I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 203 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 2 62 

I I I N I I I II Mill IN I I | I I I I | I I I I I 

Db 22 8 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

Qy 2 63 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

M I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II II I II || 
Db 288 T CT ACT TCAAGT G CAAC GGC GAGT GGGT CAG C CAGAAC GAC C ACGT CAC ACAGGAAGGC C 347 

Qy 3 2 3 CAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGG 382 

I > I I II I I I I I I I I I I I I || I I I I | I | | | 

Db 348 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 4 07 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I IN 'I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 111 

Db 408 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 4 67 

Qy 443 GCAC CAC C AAGAGT C AGAAGGC CTACAT C C G CAT AG C C AGAT T GC G C AAGAACT T C GAGC 502 

I I I I I I I I M I I I M I I I I I | I I | | | | | Ml I I I I I I I I I I I I I I I | | 

Db 4 68 GCAC CAC CAAGAGT C GC C GAGC CTAC GT C CGCAT C GC CT AC CT GC G CAAGAACTT C GAT C 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 



528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 5 87 



563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

M I I I I I I I I I I I I I I I I I | | | |.| | | | | | M I I I I I I MINI 

588 CG GAGG GGGT GC CT GT GGC C GAGGT G GAAT GG CT C AAGAAT GAG GAT GT CAT C GAC C CC A 647 
623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

M I I i I I I I I I I M I I I I I I I I I I I I I I I I I I 

648 CCCAGGACACCT^VCTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

683 T T G CT GAC AC GGC C AACT AC AC CTGCGTGGC C AAGAAC AT C GT G GC AC GT C G C C GCAGC G 742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i 

708 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 767 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

II III I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

8 03 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

INI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
828 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II M M I II I || M | | | | | MMI III II I I I II II I I I I I I Ml 

888 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I MM II I II I II II I I I I I I 

948 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

Ml I I I I I M I II I I I II II I II I | || II MUM I 

1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

1043 AGT GC CAGGGCACT GAC CT GGACAC CCGCAACT GTAC CAGT GACCT CT GTGT ACACAGT G 1102 

I I I I I I I I I I I I I I I I I I I M M II I I IM I 

1068 ACTGCAGCGGGACGCT GCT CGACT CTAAGAACT GCACAGAT GGGCT GT GCAT GCAACT GG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I I II I I Ml I I I I 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

Ml M II I Ml III I I I I I I I I 

1188 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1223 ATGTGGCTGACTCGTCCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

I I I I I I I I I I I I I I I I I I I I I | 

124 8 AC AT CAC T GACT CAT CTGCTGCCCT GACT GGT GGTT T C C AC C C C GT C AAC TT T AAGAC G G 1307 

1280 G C AAAG C AG ACAAC C C C CAT C T G C T CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I I I I I I II I I || || || || I II I I I I I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 C CAC CAC CT AC C AGG G CAGT CTCTGTCCCCGG C AGGA 1370 

II I I I I I I I II I I I II I M I I I I 

1368 C CGG CAT CT AC C G C GGACC C GT GTAT G C C CT GC AGGACT C CAC C GACAAAAT C C C CAT GA 1427 



1371 



TGGGCCCAGCCCCAAGTTCCAGCTCACCA- 



1399 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I I I I I I I III II II II II 

1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I I M 

14 88 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I II I Ml I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 



1508 



1552 



TCCGCTC CCTGCCCC GAG G C AC C AG C AAC AT GAC C TAT G G G AC C T 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I I I I I I I I I I I I I I I I I I Mill M I I I I II MM 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 C AGAT G C CAT AC C C C GAGG GAAGAT CT AT GAGAT CT AC CT C AC GCT G C ACAAGC C GGAAG 1672 

I I I I I I I I I I M I II I M I I II II II II I I I II I I I I I 

1728 AT G GAG C CATT C C C CAGGGCAAGT T CTAC GAGAT GTAT CTACT CATCAACAAGGCAGAAA 17 87 

1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I II II II Mill I I II I I I I II I I I II M II 

1788 GTACCCTGCCGCTTTCAGAAGGGACCCAGACAGTATTGAGCCCCTCGGTGACCTGTGGAC 1847 

1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 17 92 

I I I II I II II I II I I I II I I M M II I II I I II II M I II II 
184 8 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I I II I I I I Mill! II I I I I I I II I I II I I I I I I 

1908 GT G C C C GT GACT GGATCT T T CAGCT CAAGAC CCAG GC C CAC C AG G GC CACTGGGAGGAGG 1967 

1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I I I II I I I I II I I I I I I I I II II I I I M II I II I I I II I 
1968 T GGT GACCCT GGAT GAGGAGACC CT GAACACAC C CT GCT ACT GC CAGCT GGAGCC CAGGG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

II I I I I II I II II I II I I II II I I I II II I II I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I II I II II II II I I I I II I I I M II I I II II II M II I I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

2033 AGT ACAACAT CCGGGT CTACT GCCT GCAT GACACCCACGAT GCACT CAAGGAGGTGGT GC 2092 

I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I II I I I I I II I II I II 

2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

II I II II I I II I I I I II I Ml II I I I II II I M I II I 
2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 



Qy 



2153 ACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTA 2212 

II II I I I I II I M I M I I M M I I I I II I I I I II I Ml I I II I M I 



Db 2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 

Qy 2213 AG CT C CT T GT C AG CT AC C AGGAGAT C C C CT T T TAT C AC AT CT GGAAT G G C AC GC AGC GGT 2272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | Ml | 

Db 2328 AGC T G CT GGC CAAATACCAGGAGAT C C CCTT CT AT CACATTT GGAGT GG C AGC CAGAAGG 2387 

Qy 2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I I I I I I I I I I I I I I I I I I I II I I III | | | | M | | | | 

Db 2388 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2447 

Qy 2 333 AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 2392 

M I M I I I I I I I I I I | | | | | | | | | | | | M | | | || | 

Db 2448 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 



2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2AA9 
' ' 'I' M M I I I Ml I 

CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 



Db 2508 



Qy 24 50 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

HI I I I I I I I I II I I I I I I I I I I II I I I || 

CCCAGCT GGGACCTTAT GCCT T CAAGATCC CACT GTCCATC CGC CAGAAGATAT GCAACA 2627 



Db 2568 



Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

I I I I I I I III M I I I I I I II I I I I I I II I I M I III 

GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 



Db 2628 



Qy 257 0 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I | I I I I | | | IN 
Db 268 8 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I I I I I I | I I I I I I | | | | | | M | M | 

Db 274 8 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I M I I I I II | | I I I I I I | | | | | | 

Db 28 08 AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 28 60 
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Query Match 34.0%; Score 936.2; DB 13; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 9e-228; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7 

143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 
HI IN II I I I I I I I I I I I | | | | | M I I I I I I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 2 03 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 2 62 

I I I I I I I I I I I I I III I I I I IN I II I I I II I 

Db 22 8 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 2 87 

Qy 2 63 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | || M 
Db 288 TCTACTTCAAGTGCAACGGCGAGTGGGTCAGCCAGAACGACCACGTCACACAGGAAGGCC 347 

323 CAGAC GGGAGCAGT GGGC T GC C C AC C AT GGAGGT C CGC ATTAAT GT CT CAAGGCAGCAGG 382 
I I I I N I I I M I I I I I I I II I I I I I I I I I I I I I I 

Db 348 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 



Qy 


383 


Db 


408 


Qy 


443 


Db 


468 


Qy 


503 


Db 


528 


Qy 


563 


Db 


588 


Qy 


623 


Db 


648 


Qy 


683 


Db 


708 


Qy 


743 


Db 


768 


Qy 


803 


Db 


828 


Qy 


863 


Db 


888 


Qy 


923 


Db 


948 


Qy 


983 


Db 


1008 


Qy 


1043 


Db 


1068 


Qy 


1103 


Db 


1128 


Qy 


1163 


Db 


1188 



TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 4 42 

I IN II I M I I I I I II I I I I I I I I I I I I I | | | I I I I I I I 

TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 4 67 

GCACCAC CAAGAGTCAGAAGGCCT AC AT C CGCATAGC CAGATT GC GCAAGAACTT CGAGC 502 

I I I I I I I I I M I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

GCACCACCAAGAGTCGCCGAGCCTACGTCCGCATCGCCTACCTGCGCAAGAACTTCGATC 527 

AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I M II I I I I I II I I I I I I I I I I I I I I I I I I | I I I I I I I I 

AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
CGGAGGGGGTGCCTGTGGCCGAGGTGGAATGGCTCAAGAATGAGGATGTCATCGACCCCA 64 7 

CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 
I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 

CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I Mill I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I Ml 

T GT CGGACAC T GC CAAC TATACCT GC GT GGC CAAGAAC AT C GT GG C CAAAC G C C GGAGC A 767 

CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

II I N I I I I I I I I I I I I I I I I I I I | | | M I I I I I I I I I I I I I I I I 
CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 8 62 

I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 
I M I I I I I I I I II II I I | I I I I I I I III I I I I I I I II I I I I I I III 

CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

HI I I I I I I I I I I I I I I I I I I I I I I 

CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

IN M I M I I I I I I I I I II I I I I I I I I I I I I I I I 

AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

AGT GC C AG GGCACT GAC CT GGACAC C C GCAACT GTAC CAGT GAC CT CT GT GTACACAGTG 1102 
I I I I I I I I I I I I I I I I I I I I I M I I I I III | 

ACTGCAGCGGGACGCTGCTCGACTCTAAGAACTGCACAGATGGGCTGTGCATGCAACTGG 1127 

CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I III I Ml | | | | 

AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

IN M M I I I I II I I I I I I | I I I I I I I 

CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 



Ov 


1223 


Db 


1248 


Ov 
vy 


1280 


Db 


X -_> VJ o 


wy 


1 ^4 

1J J4 




1 ^6ft 


Ov 
vy 


1371 


Dh 


1 4 9 R 

X H O 


Ov 
wy 


1400 


nh 


1 4 ft ft 


Ov 
wy 


1448 




1 R4 ft 
J. D H. 0 


yy 


1 SDft 
x o u o 


L/yJ 


i ^nft 


0\7 


1J JJ 




1 ££ft 

X D D D 


Ov 




nh 


x / O 


Ov 


1 67^ 


nh 


1 7 ft ft 
1 / DO 


Ov 

wy 


17^ 

X / O -J 


Db 


1 ft d ft 

X040 


Ov 


1 7Q^ 


Db 


1 QDft 

X U O 


Ov 
vy 


1 ft 


Db 




Qy 


1913 


Db 


2028 


Qy 


1973 



ATGTGGCTGACTCGTCCATT C T C AC C T C AG G C T T C C AG C C C GT C AG CAT C AAG C C C A 1279 

Ill II I MM. I I I I I I I II I I I II I I II I I 

ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 



1333 



GCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGCACCACCA 

I I I I I II || I M I I I II I 

C7UVGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1370 

M I I I I I I I II I I I I I I I I I I I I 

CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAA7AATCCCCATGA 1427 

TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I I I I I I I I I I I I II 
CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 14 87 

- -ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I M I I I I I I I I I I I I I I I IN 

CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

M I I I I I I I I I I I I I I I I I I I I || 

GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

TCCGCTC CCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCT 1552 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I M I I I I I I I I M I I I I I I I I I I I I I I I I III 

TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 



I M I I I I I I I I I I I I I I I I I I I II M | | 



I Mill I III 



ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I M M M I I I I I I I I I I I M I I I I I II I I | | 

GT AC CCTGCCGCTTT CAG AAG GGAC C C AGAC AGT AT T GAG CCCCTCGGT GAC CT GT GGAC 1847 

CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 1792 
I I I M I I I I I I I I I I I I I M II M I I I I II M I I I I I I II II 
CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 
I I I I I I I I I I II II I I I I I I I I M II I II II II I I I 

GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I Mill I I I I I I I I I I I I | | | | | M M I I I I I I I 

TGGTGACCCTGGATGAGGAGACCCTGAACACACCCTGCTACTGCCAGCTGGAGCCCAGGG 2027 

CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 
I I I I I I I I I M I I II I I I I I II I I I || | | | | | | 

CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 



Db 


2088 


1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCTCAGCAGTCTVAGCGGCTCCAGCTGGrrnTrTTrnrrrrrr^rrrTrTrrarrTrrrTrr 


01 An 

Z ±4 / 


Qv 


2033 


AGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGC 

1 1 1 1 1 1 II 1 1 Ill 1 II 

AGTACAGCCTCCGGGTCTACTGCCTGGAGGArArr;rrTr;TAr:r ArTrzxarrarrTrrTrr 


z uyx 


Db 


2148 


Z Z U / 


Qy 


2093 


AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 

1 1 1 1 1 1 II 1 1 1 1 1 II || I I 1 1 1 1 1 

AGCTGGAGCGGACTCTGG(^rGfJATArTTf;nT^nz\rrflrrrranarrrrT7\7\TrTTr7\arr 

nu\^ i uunuuuijn^ j, ^- i. oou^juni rtt 1 1 ub 1 oo/\bbAuLLb/WiLl.bt 1 AAl bl 1 UAAbibi 


Z JLOZ 


Db 


2208 


ZZ O / 


Qy 


2153 


ACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MM III I 1 1 1 1 1 1 1 

ACAGTTACCACAArrTGfGrrTrTrrPTrraTnarrTrrrrra'rrr'r'r'aTTrrflrrArr'n 


2212 


Db 


2268 


O O O 1 

z3z / 


Qv 
Db 


2213 
2328 


AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 
1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 I M 1 

nvjv^i o^i uu^^mni.rtL.^rtuijnbnl ^LL^l lbl/\ib/iL/\l 1 1 bbAb X bibjUAbjCLAbjAAbjbj 


2272 
2387 


Ov 
vy 


2273 


ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | Ml Mil 1 II I 1 1 

rrrTrrAPTnrArTTTrArrrT^nacarrpar , flrf ,r rTrrr , r ,r T i rr , 7\r < 7\rnr'r , mr'7\ r>r<mrri7i 
^-^^ x *-«w-y^ x o^^-v^ xxx x o icr/\^/\^j (j Abr b. 1 1 brbjCU x b. bAbAbAbj b. 1 bA.CC 1 GCA 


2332 


Db 


2388 


2447 


Ov 
wy 


2333 


AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 

1 1 1 1 1 1 M M 1 1 1 II 1 1 1 1 1 1 I I M I 1 III 1 I II | 

AGATrTGrGTGr(^GrAAnTnnAAP^r;^arrrrr , araTa r r r rr , parrTrrA'?APP7\r'frr<rTir'r' 

rvjr\±\^ ± vjv^vjx u^ou^rtnu X bbhrtbbubAbbbbb/ibAl 1 LLAbb 1 brCAl AbbAbi bl bjG 


2392 


Db 


2448 


o d r\ "i 


Qv 
vy 


2393 


CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 

1 M III II II 1 II 1 II I 

CAGAGAC , ArrTGrTnnrTfrrTnnAf , ArTrTrTr:rTr r ?rrrrrTrrrnrr7\r"Fr'pr , 7\pr 4 A 


O A A Ci 

Z449 


Db 


2508 


O t £T ""J 

Zoo/ 


Qv 


2450 


CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 II II 1 II II 1 1 II 

CCCAGf TGGGArrT r rA r r^rrT r ?rAAraTrr , rz\rTr r rrrn r rr , r , rrrflr'n 7v/~7\rn7\rnr , r«7\7\/-«7\ 
^.uun^iouunL^i x/-vxvj^^x x w\f-\Lj/\X ^L^L^rt.^ X bil bbAl L-CbrCbAbjAAbjAl Al CjUAACA 


O C A A 

Z509 


Db 


2568 


o ^~ o n 
Z OZ / 


Ov 
vy 


2510 


GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 
1 M 1 II 1 II 1 1 1 I I I 1 II 1 1 II II 1 1 1 1 II II 1 1 1 1 
GCCTAGATGCCCrrAArTrArn^nrAATnArT^rrrATrTTZirrnrnrBarrTrTr^ 

\j^*~> -l nuni v_* ^ u \\s _l unVjUbbbbnnl bn^ X oo^bbrtl bl 1 rt.br b-Ab*AbjAAbrC IblblA 


O d o 

zb69 


Db 


2628 


Zoo/ 


Ov 
vy 


2570 


TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 II II 1 1 1 1 1 II 1 1 1 1 III 
TGGArrGGTArrT^AATTArTTTnrr , Arraanrzrrarr'r 4 rraprrrT , r , rprAmr , r , rpr , r'APP 

luunuL-uuirtVyblbmj. ±t\\~>± X 1 u^L./\L.U/lA/ibb.brAbbbbbAbbbbI bl bAl bb 1 bbAbb 


Z oz 9 


Db 


2688 


Z /4 / 


Ov 

vy 


2630 


TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 | | | M 1 M Ml | 
TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 


2689 


Db 


2748 


2807 


Qy 


2690 


GACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 27 42 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2860 




Db 


2808 





RESULT 14 
US-10-218-779-1 

; Sequence 1, Application US/10218779 
; Publication No. US2004 002 9222A1 
; GENERAL INFORMATION: 



APPLICANT: Edinger, Shlomit 
APPLICANT: MacDougall, John 
APPLICANT: Millet, Isabelle 
APPLICANT: Ellerman, Karen 
APPLICANT: Stone, David 
APPLICANT: Gerlach, Valerie 
APPLICANT: Grosse, William 
APPLICANT: Alsobrook II, John 
APPLICANT: Lepley, Denise 
APPLICANT : Rieger, Daniel 
APPLICANT: Burgess, Catherine 
APPLICANT: Casman, Stacie 
APPLICANT: Spytek, Kimberly 
APPLICANT: Boldog, Ferenc 
APPLICANT: Li, Li 

APPLICANT: Padigaru, Muralidhara 
APPLICANT: Mishra, Vishnu 
APPLICANT: Patturajan, Meera 
APPLICANT: Shenoy, Suresh 
APPLICANT: Rastelli, Luca 
APPLICANT: Tchernev, Velizar 
APPLICANT: Vernet, Corine 
APPLICANT: Zerhusen, Bryan 
APPLICANT: Malyankar, Uriel 
APPLICANT: Guo, Xiaojia 
APPLICANT: Miller, Charles 
APPLICANT: Gangolli, Esha 

TITLE OF INVENTION: Proteins and Nucleic Acids Encoding Same 
FILE REFERENCE: 21402-214 

CURRENT APPLICATION NUMBER: US/10/218 , 779 
CURRENT FILING DATE: 2002-08-14 
PRIOR APPLICATION NUMBER: 60/253,834 
PRIOR FILING DATE: 2000-11-29 
PRIOR APPLICATION NUMBER: 60/250,-926 
PRIOR FILING DATE: 2000-11-30 
PRIOR APPLICATION NUMBER: 60/264,180 
PRIOR FILING DATE: 2001-01-25 
PRIOR APPLICATION NUMBER: 60/313,656 
PRIOR FILING DATE: 2001-08-20 
PRIOR APPLICATION NUMBER: 60/327,456 
PRIOR FILING DATE: 2001-10-05 
NUMBER OF SEQ ID NOS : 216 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 1 
LENGTH: 2860 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-218-779-1 

Query Match 34.0%; Score 936.2; DB 13; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 9e-228; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 

Qy 14 3 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml Ml M I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 



203 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 2 62 

Hill H I I I I I II Ml | | | Ml | MIMMI I I I I 

228 CCTACATTGTGAAGAACAAGCCTGTGGAGCTCCGCTGCCGCGCCTTCCCCGCCACACAGA 287 

2 63 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I M I I I I I I I I I I I I I III II I I 

288 T C T AC T T C AAGT G C AAC G G C G AGT G G GT C AG C C AG AAC GAC C AC GT C AC AC AG G AAG G C C 347 

323 C AGAC GG GAGC AGT GG GC T G CC C AC CAT GGAGGT C C GC AT T AAT GT CT C AAG GCAG C AG G 382 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

34 8 TGGATGAGGCCACCGGTCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 4 07 

383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I I M II I II I I I I I I I I I I I I I I I I I I I I I | | | | | | | | || | | | | | | | M Ml 
4 08 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCGG 467 

4 43 GCAC CACC AAGAGT CAGAAGGC CTACAT CCGCAT AGC CAGATT GC GCAAGAACTTC GAGC 502 

M I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I | 

4 68 GCACCACCAAGAGTCGCCGAGCCTACGTCCGCATCGCCTACCTGCGCAAGAACTTCGATC 527 

503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | M | | M I 
528 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

563 C GGAG GGCAT C C C T C C AG C C GAGGT G GAGT G GC T C C GGAAC GAGGAC CT GGT GGAC C C GT 622 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
58 8 CGGAGGGG GT GCCT GT G GCC GAGGT GGAAT GG CT CAAGAAT GAGGAT GT CAT C GAC C C C A 647 

623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I I I I I I I I I I I I I I | | I I I I M I I I I I I I 

648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

683 TT GCT GACACGGC CAACTACACCT GC GT GGCCAAGAACAT CGT GGCACGT CGC CGCAGCG 742 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I II I II III 

708 T GT C G GAC ACT GC CAACT AT AC CT GCGT GGCCAAGAACAT C GT GG C CAAAC GCC GGAGC A 7 67 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

I I I I I MM I I I I I I I I I I | I I I I I I I I I I I I 

768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
82 8 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 8 87 

8 63 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I H I I I I I I I I II II I I I I I I I I I I Ml I I I M I I II I I I I I I III 

888 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 947 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I 

948 CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 

983 ACT G C AC C C ACT G GC G GAG C C GT GAGT G CT C T GAC C C AGC AC C C C GC AAC GGAG GGGAG G 1042 
IN I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I 
1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 



1043 AGT GC C AGG G C AC T GAC CT GGAC AC CC GCAACT GTAC CAGT GAC CT CT GT GT ACACAGT G 1102 



Db 1068 ACTGCAGCGGGACGCTGCTCGACTCTAAGAACTGCACAGATGGGCTGTGCATGCAACTGG 1127 

Qy 1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I I I I I I I I I I I I I I I III I I I I 

Db 1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

Qy 1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

I M M M I I I I I I I I I I I I I I I I I I I I 

Db 118 8 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

Qy 1223 ATGTGGCTGACTCGTCCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCA 1279 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 124 8 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 

Qy 12 8 0 G C AAAGCAGAC AAC C C C CAT CT G CT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I IN I II || I I I I I M I I I I I 

Db 1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

Qy 1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 1370 

II I I I I I I I II I I I I I II 

Db 1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGAC^J^ATCCCCATGA 1427 

Qy 1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I I I I I I I I I I I I II 
Db 142 8 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 1487 

Qy 14 0 0 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I I I I I I I I I I I I I I I I I I I IN 

Db 14 8 8 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

Qy 144 8 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

I I I I I I I I I I I I I I t lilt II I || 

Db 154 8 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

Qy 1508 TCCGCTC CCTGCCCC GAG G C AC C AG C AAC AT GAC C TAT G G G AC C T 1552 

I I I I I I I I I II I I I II I I I I I I I I I I I I I 

Db 1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 

Qy 1553 TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 1612 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I 

Db 1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

Qy 1613 C AGAT G C CAT AC C C C GAGG GAAGAT CT AT GAG AT C T AC CT C AC GCT GC ACAAG C C GGAAG 1672 

I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1728 AT G GAGC C AT T C C C C AG GGC AAGT T CT AC GAGAT GT AT CT AC T CAT C AAC AAG G C AGAAA 1787 

Qy 1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I M M II I I I I I I I I I I I I I I I I I II I I I I I 

Db 178 8 GTACCCTGCCGCTTTCAGAAGGGACCCAGACAGTATTGAGCCCCTCGGTGACCTGTGGAC 1847 

Qy 1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 17 92 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II 
Db 1848 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

Qy 1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 
I I I I I I II II Ml 



Db 1908 GTGCCCGTGACTGGATCTTTCAGCTCAAGACCCAGGCCCACCAGGGCCACTGGGAGGAGG 1967 

Qy 1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

MM M M I M M M I I I I I I I I I I I I II I II I I I I I I I I I I 

Db 1968 T GGT GAC C CT G GAT GAGG AGAC C CT GAAC ACAC C CT GCT ACT GC CAGCT G GAGC C CAGGG 2027 

Qy 1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

MM M M I I I M M M M I I I I I M I M I M I 

Db 2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

Qy 1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I I I I M M M Ml M I M I M I I M I M M M M M M I 

Db 208 8 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

Qy 2033 AGT ACAAC AT C C GGGT CT ACT GCCT GCAT G ACAC C C AC GAT GCACT CAAGGAG GT GGT G C 2 092 

I M M I I M M M M M M M M I I M I M I I M M I M I M I M I I I 

Db 214 8 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

Qy 2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

M M M I I I M M I M I I Ml II I M I I II II I M II 

Db 22 08 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

Qy 2153 ACAGTT ACCACAACCT GC GC CT AT C CAT CCACGAT GT GC CCAGCT CCCT GT GGAAGAGT A 2212 

I I II II I II II I I II II I II II I I I II II II I I I I Ml I I I I I I I I 

Db 2268 ACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGGAGGAGCA 2327 

Qy 2213 AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 2272 

MM II I II II I II I II I II I I II I I I I I I I I I I II I I Mill III I 
Db 2328 AGCT GC T GG CCAAAT AC CAG GAGAT C C CCT T CT AT CACAT T T GGAGT GGCAGC CAGAAGG 2387 

Qy 2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I M I I I II I M II I II II II I I I II III II I I I II II I 

Db 2388 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 24 47 

Qy 2333 AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 2392 

I I I II II I II I I II II I I I II II II II III I I II I 

Db 244 8 AGATCTGCGTGCGGCAAGTGGAAGGGGAGGGCCAGATATTCCAGCTGCATACCACTCTGG 2507 

Qy 2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2449 

III III II II I II I I I I 

Db 2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

Qy 2450 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

I I I I II II I I I I I I I II I II I M I I I I I I II II I I II I M II 

Db 2568 C C CAG CT GGGAC CT TAT GC CTT CAAGAT CC CACT GT C CAT C CGC CAGAAGAT AT GCAAC A 2627 

Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

II M II I Ml I I I I I I II I I I II I I I I I II II I I II 

Db 262 8 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 

Qy 257 0 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

M I II I I I I I I I I I I II I I I II I II I II II I I I I I I I II III 
Db 268 8 TGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATCCTGGACC 2747 

Qy 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2 689 

I II M I I I I I I I I I I I I II I II I II I II II III I 

Db 2748 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 



Qy 

Db 



2690 , GACT GGG C CAGCC AGAC GCT G GC C T CT T CACAGT GT C G GAGGCT GAGT G C TGA 2742 

I I I I I I I II I I I I I I I I I I I I I I 

2808 AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2860 



RESULT 15 
US-10-218-779-3 

Sequence 3, Application US/10218779 
Publication No. US20040029222A1 
GENERAL INFORMATION : 
APPLICANT: Edinger, Shlomit 
APPLICANT: MacDougall, John 
APPLICANT: Millet, Isabelle 
APPLICANT: Ellerman, Karen 
APPLICANT: Stone, David 
APPLICANT: Gerlach, Valerie 
APPLICANT: Grosse, William 
APPLICANT: Alsobrook II, John 
APPLICANT: Lepley, Denise 
APPLICANT: Rieger, Daniel 
APPLICANT: Burgess, Catherine 
APPLICANT: Casman, Stacie 
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; ORGANISM: Homo sapiens 
US-10-218-779-3 

Query Match 34.0%; Score 936.2; DB 13; Length 2860; 

Best Local Similarity 61.7%; Pred. No. 9e-228; 

Matches 1662; Conservative 0; Mismatches 938; Indels 93; Gaps 7; 

Qy 143 ACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATG 202 

Ml Ml II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 168 ACTCCTTCCCGTCAGCGCCAGCAGAGCCGCTGCCCTACTTCCTGCAGGAGCCACAGGACG 227 

Qy 2 03 TGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGA 2 62 

I I I II I I I I I I I I I I I I I I I I I I II II! I I I I I I I I I I I I I I I I 
Db 22 8 CCTACATTGTGAAGAACAAGCCTGTGGAGCTTCGCTGCCGCGCCTTCCCCGCCACACAGA 2 87 

Qy 2 63 TCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCA 322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II 
Db 288 T C T AC T T C AAG T G C AAC G G C G AGT G G GT C AG C C AG AAC G AC C AC G T C AC AC AG G AAG G C C 347 

Qy 323 C AGAC GGGAGC AGT GGGCTGCC C AC CAT G GAG GT C C GC AT T AAT GT CT CAAGGC AGC AGG 382 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II 

Db 34 8 TGGATGAGGCCACCGGCCTGCGGGTGCGCGAGGTGCAGATCGAGGTGTCGCGGCAGCAGG 407 

Qy 383 TCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGG 442 

I Ml II I II I I I I I I I I I I I I I I I I | I | | | | I.I | | | | | | | I I I I I I I I I I I 
Db 4 08 TGGAGGAGCTCTTTGGGCTGGAGGATTACTGGTGCCAGTGCGTGGCCTGGAGCTCCGCAG 4 67 

Qy 4 43 GCACCACCAAGAGT CAGAAGGCCTACAT CCGCATAGCCAGATTGCGCAAGAACTT CGAGC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I I I I I I I I 

Db 4 68 GCAC CAC CAAGAGT C GC C GAG C CT AC GT C CGC AT C GCCTAC CT GC GC AAGAACT T C GAT C 527 

Qy 503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 

I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I I I I I I I I I I I I 
Db 52 8 AGGAGCCTCTGGGCAAGGAGGTGCCCCTGGACCATGAGGTTCTCCTGCAGTGCCGCCCGC 587 

Qy 563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I II I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I Mill 
Db 588 C GGAGGGGGTG C CT GT GG C C GAGGT G GAAT GG CT CAAGAAT GAGGAT GT CAT CGAC CC CA 647 

Qy 623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I I I I I II II II I I I I I II I I I I I I I I I II II II I I I II I 

Db 648 CCCAGGACACCAACTTCCTGCTCACCATCGACCACAACCTCATCATCCGCCAGGCCCGCC 707 

Qy 683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I II I I I I I II II I M II I I I II I I I I II II I II I I I I II II I 

Db 708 TGTCGGACACTGCCAACTATACCTGCGTGGCCAAGAACATCGTGGCCAAACGCCGGAGCA 7 67 

Qy 743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 8 02 

I I I I I I I I I I II II II II II I II I I I I I II I I I I II I I II II I I I 
Db 768 CCACTGCCACCGTCATCGTCTACGTGAATGGCGGCTGGTCCAGCTGGGCAGAGTGGTCAC 827 

Qy 803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 8 62 

I II I I I I M I II I II II II I I II II I II I II I II I I I I I II II I II I 
Db 82 8 CCTGCTCCAACCGCTGTGGCCGAGGCTGGCAGAAGCGCACCCGGACCTGCACCAACCCCG 887 

Qy 8 63 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I M I I M II I I M II II II I Mill III I II II II II II I II I III 
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8 8 8 CTCCACTCAACGGAGGGGCCTTCTGCGAGGGCCAGGCATTCCAGAAGACCGCCTGCACCA 94 7 



923 



948 



983 



CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I MM II II II M I M M M M M I I I 

CCATCTGCCCAGTCGATGGGGCGTGGACGGAGTGGAGCAAGTGGTCAGCCTGCAGCACTG 1007 



ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

I M I I I II II M I II II I M | | 

1008 AGTGTGCCCACTGGCGTAGCCGCGAGTGCATGGCGCCCCCACCCCAGAACGGAGGCCGTG 1067 

1043 AGT GC CAGGGC AC T GAC CT G GAC AC C C GCAAC T GT AC C AGT GAC CT C T GT GT AC AC AGT G 1102 

I I I I I I M I I II I I I I II I I I II I I I I IN I 

1068 ACTGCAGCGGGACGCTGCTCGACTCTAAGAACTGCACAGATGGGCTGTGCATGCAACTGG 1127 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGG 1162 

I Mill I I I I I I I I I III I I I | 

1128 AGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTGGTCGTGG 1187 

1163 TCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAG 1222 

III M M I I I I I I I I I I I I I I I I I I I I 

118 8 CAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTCGACACAG 1247 

1223 ATGTGGCTGACTCGTCCATT C T C AC CT C AGG CT T C C AG C C C GT C AGCAT CAAGC C C A 127 9 

I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I 

124 8 ACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTTAAGACGG 1307 

1280 GCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGCACCACCA 1333 

I I I I II I M I I I I II II I I | M | | | | M I 

1308 CAAGGCCCAGTAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACAGCCAGCG 1367 

1334 CCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGA 137 0 

M I I II I I I II I I I II I I II I II 

1368 CCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATCCCCATGA 1427 

1371 TGGGCCCAGCCCCAAGTTCCAGCTCACCA 1399 

I I I I I I I I M I I II I I II 
1428 CCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGCTCCAGCA 148 7 

1400 — ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACAC ACTGCACC 1447 

I I M I I I I I I M I I I I I I I I | | I 

14 88 CCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTGCCGCCTG 1547 

1448 ACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACT 1507 

M I M I I I I I I M I I I I I I I I I II 

1548 GCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGCGCCAGCC 1607 

1508 TCCGCTC CCTGCCCC GAGGCAC C AGCAAC AT GAC CT AT GG GAC CT 1552 

Mill I I I I I I I I II I I I I I I I I I I I I I I 

1608 TCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGCGGCACCT 1667 



1553 



1612 



TCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCC 
I II I II I I I I I I I I I I I I M I I I I I I I I I I I II I I I I 

1668 TTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTGGTGCCCA 1727 

1613 CAGAT GCCAT ACCC CGAGGGAAGAT CT ATGAGAT CTAC CT CACGCT GCACAAGC CGGAAG 1672 

I II I I I I II I I I M I II I I I II II II II I I I I I I I I II 

1728 ATGGAGCCATT C CC CAGGGCAAGTTCTACGAGAT GTATCTACT CATCAACAAGGCAGAAA 178 7 
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1673 ACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGAC 1732 

I M - II II I I I I I | I I I I II I I I I I I I I I I I I 

1788 GT AC CCTGCCGCTTT C AGAAG GGAC C C AGAC AGT AT T G AGC C C C T C GGT GAC CT GT GGAC 184 7 

1733 CCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCA 17 92 

I I I I I I I I I I I I I I I I I I I I II I I I MINI II II 

184 8 CCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCCGAAGTCA 1907 

1793 GCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATG 1852 

I I I I I I I I I I I I I I I I I I I I I I M I I II I 

1908 GT GC C C GT GACT GGAT CTT T C AGCT CAAGAC C CAG GC C CAC C AGGG C C ACTGGGAGGAGG 1967 

1853 TGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTG 1912 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1968 T GGT GAC C CT G GAT GAGGAGAC C CT GAACACAC C CT G CT ACT G CCAGCT GGAGC C CAG GG 2027 

1913 CCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCG 1972 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2028 CCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCCTATTCCC 2087 

1973 TGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCG 2032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

2088 GCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACCTCCCTGG 2147 

2 033 AGTACAACAT C C GGGT C T ACT GC CT GCAT GAC AC C CAC GAT GC ACT CAAGGAGGT GGT GC 2092 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M M I I I I I I I I I I II 
2148 AGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAGGTGCTGG 2207 

2093 AGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGG 2152 

I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I I I 

2208 AGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATGTTCAAGG 2267 

2153 ACAGTTACCACAACCT GC GCCT AT CCAT CCACGAT GT GC CCAGCT CCCT GT GGAAGAGTA 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 

2268 AC AGT T AC CACAAC CT G C GCCT CT C CCT C CAT GACCT C C C C CAT GCC CAT T GGAG GAGCA 2327 

2213 AGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT 2272 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I 
2328 AGCT GC T GGCCAAAT AC CAGG AGAT C C C CT T CT AT C AC AT TT GGAGT G G C AGC CAGAAGG 2387 

2273 ACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCA 2332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

2388 CCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTCACCTGCA 2447 



2333 



2392 



AGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCA 
M I I I I I I II I I I I I I I I I I I I I I I I I III I I II I 

2448 AGATCT GCGTGC GGCAAGT GGAAGGGGAGGGC CAGATATT CCAGCTGCAT ACCACT CTGG 2507 

2393 CCAAG GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAG 2449 

III III II II I II I I I I 

2508 CAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACTGTCACCA 2567 

2450 CCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCA 2509 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2568 C C CAGC T GGGAC CT TAT G C CT T CAAGAT C C CACT GT C CAT C C GC CAGAAGAT AT G CAAC A 2627 



Qy 2510 GCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACC 2569 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

Db 2628 GCCTAGATGCCCCCAACTCACGGGGCAATGACTGGCGGATGTTAGCACAGAAGCTCTCTA 2687 

Qy 2570 TGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACC 2629 

I I I I I I I I I I I I I I I I I I I I HI | | | | | | | M I 

Db 2 688 T GGAC C GGTAC CT GAAT T AC T TT GC C AC CAAAGC GAG C C C C AC G GGT GT GAT C CT GGAC C 2747 

QY 2630 TGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTG 2689 

I I I I I I I I I I I I I I I I I I I I I I I I I I | | M M I I 

Db 27 4 8 TCTGGGAAGCTCTGCAGCAGGACGATGGGGACCTCAACAGCCTGGCGAGTGCCTTGGAGG 2807 

Qy 2690 GACT G GGC CAG C C AGAC GCTGGCCT CTT CAC AGT GT C G GAG GC T GAGT GC T GA 2742 

Mill || | | I II I I I II II I I 

Db 2808 AGATGGGCAAGAGTGAGATGCTGGTGGCTGTGGCCACCGACGGGGACTGCTGA 2860 
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